[OSM-talk-fr] BANO VS OSM

adrien carpentier ad.carpentier at gmail.com
Dim 23 Aou 11:51:05 UTC 2015


Salut!
pour info, on a pris le taureau par les cornes sur le npdc,nous en
discutons sur la liste locale en général :
http://listes.openstreetmap.fr/wws/info/local-npdc
et bruno a développé un site d'analyses :
http://legosm.fr/bano5962/evolution.html
pour info, nous avons les 2 plus gros départements de France en terme
d'adresses (et donc de rapprochements osm/bano) :
https://openstreetmap.fr/outils/bano/status
par contre, nous fonctionnons plutôt par commune que par type d'erreurs,
mais si tes analyses nous permettent d'avancer plus vite, on es bien sur
preneurs...
@+
adrien





Le 23 août 2015 13:37, Aurélien .... <kinju59 at gmail.com> a écrit :

> Non je n'ai pas regardé la dernière analyse, je ne suis pas très à jour
> avec les outils proposés.
>
> Je pense que pour distinguer ce qui est correct ou non d'une source ou de
> l'autre il faut passer par du cas mais que l'on peut amoindrir l'effort
> humain en définissant des règles syntaxiques (expressions régulières) afin
> de gérer des "La rue de" et "Rue de" ou "Mésanges" et "Rue des Mésanges"
> afin de diminuer l'effort humain et qu'il se concentre sur les "problèmes"
> du 4ème type.
>
> La part de distinction est petite par rapport à la volumétrie mais c'est
> toujours irritant et très impactant dans le jugement d'une source de
> données lorsque celle-ci comporte des fautes de reproduction, grammaire ou
> orthographe. Ce n'est pas une critique, juste un avis ;)
>
> Pour les fichiers CSV, j'ai importé d'un côté les données OSM, d'un autre
> mes données BANO et ai effectué des requêtes PostgreSQL pour le
> rapprochement. Sous PgAdmin le "copier" du résultat est sous format CSV.
>
> Les premières lignes de "différences" :
>
> Lati Longi BANO OSM 50.478027 2.258851 La Rue Guilbert Rue Guilbert
> 50.16838 3.881105 Rue de la Queue Noir Jean Rue de la Queue Noire Jean
> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.745894 3.13725 Rue de
> la Latte Rue de Latte 50.745565 3.104056 Avenue Ponthieux Avenue Ponthieu
> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.745894 3.13725 Rue de
> la Latte Rue de Latte 50.745894 3.13725 Rue de la Latte Rue de Latte
> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.735717 3.121181 Rue
> Jules Watteuw Rue Jules Watteeuw 50.586371 2.668816 La Rue des Lobes Rue
> des Lobes 50.482092 2.266353 La Rue des Fresnes Rue des Fresnes 50.477794
> 2.266416 La Rue du Moulin Rue du Moulin 50.579298 2.689841 La Rue de
> Saint Omer Rue de Saint-Omer 50.571286 2.697869 La Rue des Wirions Rue
> des Wirions 50.567841 2.733673 La Rue des Chavattes Rue des Chavattes
> 50.588666 2.697297 La Rue des Clabauts Rue des Clabauts 50.591284 2.697928 La
> Rue Picavet Rue Picavet 50.561432 2.706571 La Rue de Loisne Rue de Loisne
> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.745894 3.13725 Rue de
> la Latte Rue de Latte 50.745894 3.13725 Rue de la Latte Rue de Latte
> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.482092 2.266353 La Rue
> des Fresnes Rue des Fresnes 50.239255 2.441026 Au Chemin de Sombrin Chemin
> de Sombrin 50.36725 2.267188 La Chapelle De La Chapelle 50.591099 2.690511 La
> Rue du Rabat Rue du Rabat 50.567841 2.733673 La Rue des Chavattes Rue des
> Chavattes 50.586371 2.668816 La Rue des Lobes Rue des Lobes 50.638747
> 1.898124 Hameau de Dignopre Hameau de Dignopré 50.61245 1.740777 Route
> Nationale Route Nationale N°1 50.609524 1.74237 Route Nationale N°1 Route
> Nationale 50.600124 3.076128 Chemin des Margueritois Chemin des
> Margueritois / Chemin Rouge 50.27574 2.755416 La Rue de Fontaine Rue La
> Fontaine 50.26947 2.755188 La Rue Pasteur Rue Pasteur
>
>
> 2015-08-23 12:26 GMT+02:00 Christian Quest <cquest at openstreetmap.fr>:
>
>> Le 23/08/2015 11:30, Aurélien .... a écrit :
>>
>> Bonjour,
>>
>> Je m'intéresse de près à la BANO pour le moment spécifiquement dans le
>> Nord-Pas-De-Calais et à coups de requêtes dans tous les sens et j'ai pu
>> sortir des "différences" entre les données BANO et les données OSM.
>>
>>
>> As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait
>> justement le croisement BANO/OSM ?
>>
>> C'est une version "osmose" du rouge du rendu BANO, plus simple à utiliser
>> pour faire les corrections les unes après les autres.
>>
>> http://osmose.openstreetmap.fr/fr/errors/?item=7170 classes 30 à 33
>>
>>
>> J'en ai catalogué différents types :
>>
>> 1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges"
>> 2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de Guise"
>> 3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier Royal"
>>
>> Ce n'est pas bien méchant mais peut-être que nous pouvons établir un
>> ensemble de règles syntaxiques afin de créer un process de correction
>> automatique ?
>>
>>
>> Et comment déterminer qui est correct ? Les données BANO issues du
>> cadastres peuvent comporter des erreurs... le cadastre n'est pas parfait et
>> n'est pas une source d'autorité (c'est uniquement la commune qui l'est).
>>
>>
>> Il y a un quatrième type de différence qui est plus inquiétant, le
>> résultat ressemble à ça :
>>
>> - BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la Fontaine à
>> l'Tuerie" => hein est bien din ch'nord lô
>> - BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du Vieux Chemin
>> de Fourmies"
>> - BANO : "Rue Hector Sandrart" - OSM : "Rue Hector Sandrard"
>> - BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal Leclercq"
>>
>>
>> Certaines erreurs peuvent être éliminées en croisant avec encore plus de
>> données, typiquement sur les noms de personnes... Il n'y a pas de "Général
>> ou Maréchal Leclercq", Clemenceau ne comporte pas d'accent, etc...
>>
>> J'ai commencé à explorer cette piste, par l'extraction de tout les mots
>> uniques afin de créer un dictionnaire. Là aussi le dictionnaire aura besoin
>> d'être validé, le tout automatique me semble hasardeux.
>>
>> Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les name,
>> mais on pourrait reduire encore plus celui-ci en le spécialisant.
>>
>> En tout le nombre de "différences" sur la région s'élève à 1137 (en
>> comptant les "faux positifs") sur 110.000 rues.
>>
>> Est-ce que ça vous intéresserait d'avoir un listing groupé par commune
>> sur l'ensemble de la métropole afin d'avoir une base supplémentaire de
>> nettoyage ?
>>
>> Si c'est le cas, comment puis-je vous transmettre des fichiers CSV ?
>>
>> Je continue mes investigation pour checker s'il n'y aurait pas des rues
>> présentes dans la BANO et absentes dans OSM.
>>
>> Pardon par avance s'il y a déjà des outils qui existent pour faire ça.
>>
>> A bientôt
>>
>>
>>
>> Comment procèdes-tu pour sortir ce CSV ?
>>
>> --
>> Christian Quest - OpenStreetMap France
>>
>>
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20150823/2b378f46/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr