Ce dépôt contient une liste de noms de domaine pointant vers des organismes remplissant des missions de service public.
Les domaines dans le fichier domaines-organismes-publics.txt
doivent
être accessible en HTTP ou HTTPS.
Le dossier sources/
contient tous les domaines connus, accessibles ou non.
La liste des domaines qui sont dans le dossier sources/
mais ne sont
pas dans le fichier domaines-organismes-publics.txt
sont
inaccessibles en HTTP ou HTTPS (n'ont pas d'adresse IP, ne répondent
pas, ...).
Pour obtenir cette liste vous pouvez utiliser :
export LC_COLLATE=C
comm -13 domaines-organismes-publics.txt <(sort sources/*.txt)
Ajoutez le ou les domaines que vous connaissez dans un des fichiers du
dossier sources/
.
Pour trier le fichier que vous venez de modifier, vous pouvez utiliser :
python scripts/sort.py sources/*.txt
Pour vérifier que tout va bien :
python scripts/check.py
Et éventuellement pour consolider dans
domaines-organismes-publics.txt
(mais c'est long) :
python scripts/consolidate.py sources/*.txt
pour consolider les sources dans domaines-organismes-publics.txt
,
dans lequels seuls les domaines répondant en HTTP par une 200 sont
acceptés.
Le dossier scripts/
contient plusieurs scripts de collecte :
- import-base-nationale-sur-les-intercommunalites.py
- import-from-ct-logs.py
2020-2021, DINUM et les contributeurs du dépôt.
Le contenu de ce dépôt est sous licence Ouverte 2.0.