[OSM-talk-fr] Robot de mise à jour des communes (ref et/ou code postal) - bilan des essais
sylvain letuffe
sylvain at letuffe.org
Mer 14 Oct 22:43:04 UTC 2009
Bonsoir,
Après plusieurs tests, recherche et résultat, j'en arrive à :
(attention blabla vous pouvez sauter au "Ce que j'envisage de faire" si vous
voulez juste savoir les opportunités)
* Concernant les codes insee
:* Problème fondamental
J'ai pas mal fouillé et j'en arrive à la conclusion que ce qu'il manque c'est
le lien position géographique<->code insee (code insee, population, nom,
arrondissement, ça c'est bien connecté)
Ici, je ne parle pas du contour de commune, ça c'est encore pire, je parle
juste de la simple présence d'un point de la commune
Source que j'ai répertorié :
- Source IGN et dérivés (donc wikipedia et dérivé, donc la majorité, précis
mais non utilisable)
- Source galichon.com (a priori libre de droit, mais de qualité plutôt
médiocre) Exemple : en Savoie il en manque 7 et environ 40 points tombent sur
la commune d'a coté. Sur 305, ça fait pas mal de commune à reprendre. (total
en france, il en manque ~1200 sur 36606)
- Source : les noeuds déjà dans osm porteur du code insee. (Dont j'aimerais
bien connaître la source !) leur positionnement est plutôt très bon, pas vu
de mauvais placement en savoie, et je suppose que leur qualité s'est affiné
avec le temps au fûr et à mesure que les osmeurs les repositionnent.
cependant leur nombre total est de 19519 sur 36606.
- Source: le cadastre lui même, je ne sais pas trop comment venir en profiter
(a part manuellement ce qu'on fait déjà plus ou moins et cf plus loin), mais
au moins les communes vecteur et les images géolocalisées devraient permettre
de trouver le positionnement. Automatiquement ça peut-être chaud, car il faut
positionner un point à l'intérieur des frontières...
:* Ce que j'envisage de faire
Au vu du dessus, je compte le faire en 3 étapes :
::*Contenu osm à récupérer
profitons déjà d'osm, 19519 noeuds disposent de l'info, il me "suffit" de la
copier vers la relation.
Je note d'une certaine manière la qualité de cette copie
::*Contenu galichon.com
Une fois l'info "plus fiable" insérée, je tente de remplir les trous avec
galichon.com
Je note d'une autre manière la qualité de cette insertion
::*Le cadastre
Par recoupement département/cadastre/osm j'arrive à fournir la liste
des "bugs" qui ne manqueront pas d'arriver sur une telle masse des étapes 1
et 2 (non présence, vol par une commune du code insee de l'autre, ...)
Ça, c'est la partie chiante, on peut imaginer des outils d'aide, mais ça reste
du crowdsourcing
:* Où j'en suis
J'ai passé mes tests à une grandeur permettant de mieux se rendre compte, j'ai
torturé la savoie :
http://beta.letuffe.org/?zoom=9&lat=45.52912&lon=6.21662&layers=B0000FFFFFFFTFFFFFF
Une relation modifiée par l'étape 1 obtient cet aspect là :
http://www.openstreetmap.org/browse/relation/74438
ref et addr:postcode sont ajoutés et deux tags inventés pour l'occasion
permettent de retrouver de quelle type de source chacun est issu.
( par l'étape 2, une autre texte de source sera indiqué)
A noter qu'a aucun moment le robot de remplace quoi que ce soit, et par
prudence, s'il existe déjà un tag "ref" la procédure est abandonnée sur cette
commune
Suivi a posteriori :
J'ai complété mon outil de statistiques (c'était le but au début) qui :
- donne le nom et le code insee des communes que le cadastre fourni pour un
département et qu'il n'a pas trouvé dans la base osm (basé sur le code insee
évidement, donc le positionnement n'y est pas)
- permet de faire une double liste vecteur/image au cadastre (les communes
vecteurs étant plus faciles à ajouter)
Un exemple pour la savoie est donné ci-près
- en bonux, si le département est complet à 100% un export au format shp en
lat/long est mis à disposition.
* Concernant les codes postaux
Bon, c'est surtout là que c'est délicat, mais de toute façon une fois le lien
position<->code_insee établi on peut revenir dessus plus tard, plus
facilement mettre à jour. Après je vois pas ce que ça change. là, y'a rien,
donc on s'en sert pas. Si demain il y a, ne toujours pas s'en servir
reviendra au même, et si quelqu'un dans un cas de figure arrive à s'en
servir... alors pourquoi pas ?
Mais j'en ferais pas un foin.
ref;name;id relation;count;cadastre;cadastre_vecto;%osm_cadastre;
%osm_cadastre_vecto
73;Savoie;7425;304;305;303;99.7 %;100.3 %
tous;tous;tous;304;305;303;99.7 %;100.3 %
###################################
Dans le département 73, ne sont pas (ou n'ont pas de ref) dans osm mais existe
en vecteur au cadastre:
ALBIEZ-MONTROND, code_insee:73013
CHAMPLAURENT, code_insee:73072
DOMESSIN, code_insee:73100
FONTCOUVERTE-LA TOUSSUIRE, code_insee:73116
HAUTEVILLE, code_insee:73133
HERMILLON, code_insee:73135
LA CHAVANNE, code_insee:73082
LA LECHERE, code_insee:73187
LA ROCHETTE, code_insee:73215
MERCURY, code_insee:73154
MOGNARD, code_insee:73158
MONTRICHER-ALBANNE, code_insee:73173
ROTHERENS, code_insee:73217
SAINT-ALBAN-LEYSSE, code_insee:73222
SAINT-ANDRE, code_insee:73223
SAINT-BERON, code_insee:73226
SAINT-CASSIN, code_insee:73228
SAINT-CHRISTOPHE-LA-GROTTE, code_insee:73229
SAINT-MICHEL-DE-MAURIENNE, code_insee:73261
SAINT-NICOLAS-LA-CHAPELLE, code_insee:73262
SAINT-PIERRE-D ENTREMONT, code_insee:73274
SAINT-PIERRE-DE-CURTILLE, code_insee:73273
ST MARTIN SUR LA CHAMBRE, code_insee:73259
THENESOL, code_insee:73292
THOIRY, code_insee:73293
VERRENS ARVEY, code_insee:73312
VILLARD-LEGER, code_insee:73315
VILLARGONDRAN, code_insee:73320
Plus d'informations sur la liste de diffusion Talk-fr