[OSM-talk-fr] BANO VS OSM

Aurélien .... kinju59 at gmail.com
Dim 23 Aou 12:51:33 UTC 2015


Ça ressemble à ça : http://kinju59.free.fr/npc.csv

Si tu as besoin de trucs supplémentaires dits moi

Merci

2015-08-23 14:27 GMT+02:00 Aurélien .... <kinju59 at gmail.com>:

> Je peux grouper par commune, où puis-je te transmettre ces infos ? Puis-je
> ajouter une pièce jointe à cette liste ?
>
> Je ferai ça pour ce soir ou demain soir au pire des cas.
>
> 2015-08-23 13:51 GMT+02:00 adrien carpentier <ad.carpentier at gmail.com>:
>
>> Salut!
>> pour info, on a pris le taureau par les cornes sur le npdc,nous en
>> discutons sur la liste locale en général :
>> http://listes.openstreetmap.fr/wws/info/local-npdc
>> et bruno a développé un site d'analyses :
>> http://legosm.fr/bano5962/evolution.html
>> pour info, nous avons les 2 plus gros départements de France en terme
>> d'adresses (et donc de rapprochements osm/bano) :
>> https://openstreetmap.fr/outils/bano/status
>> par contre, nous fonctionnons plutôt par commune que par type d'erreurs,
>> mais si tes analyses nous permettent d'avancer plus vite, on es bien sur
>> preneurs...
>> @+
>> adrien
>>
>>
>>
>>
>>
>> Le 23 août 2015 13:37, Aurélien .... <kinju59 at gmail.com> a écrit :
>>
>>> Non je n'ai pas regardé la dernière analyse, je ne suis pas très à jour
>>> avec les outils proposés.
>>>
>>> Je pense que pour distinguer ce qui est correct ou non d'une source ou
>>> de l'autre il faut passer par du cas mais que l'on peut amoindrir l'effort
>>> humain en définissant des règles syntaxiques (expressions régulières) afin
>>> de gérer des "La rue de" et "Rue de" ou "Mésanges" et "Rue des Mésanges"
>>> afin de diminuer l'effort humain et qu'il se concentre sur les "problèmes"
>>> du 4ème type.
>>>
>>> La part de distinction est petite par rapport à la volumétrie mais c'est
>>> toujours irritant et très impactant dans le jugement d'une source de
>>> données lorsque celle-ci comporte des fautes de reproduction, grammaire ou
>>> orthographe. Ce n'est pas une critique, juste un avis ;)
>>>
>>> Pour les fichiers CSV, j'ai importé d'un côté les données OSM, d'un
>>> autre mes données BANO et ai effectué des requêtes PostgreSQL pour le
>>> rapprochement. Sous PgAdmin le "copier" du résultat est sous format CSV.
>>>
>>> Les premières lignes de "différences" :
>>>
>>> Lati Longi BANO OSM 50.478027 2.258851 La Rue Guilbert Rue Guilbert
>>> 50.16838 3.881105 Rue de la Queue Noir Jean Rue de la Queue Noire Jean
>>> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.745894 3.13725 Rue de
>>> la Latte Rue de Latte 50.745565 3.104056 Avenue Ponthieux Avenue
>>> Ponthieu 50.745894 3.13725 Rue de la Latte Rue de Latte 50.745894
>>> 3.13725 Rue de la Latte Rue de Latte 50.745894 3.13725 Rue de la Latte Rue
>>> de Latte 50.745894 3.13725 Rue de la Latte Rue de Latte 50.735717
>>> 3.121181 Rue Jules Watteuw Rue Jules Watteeuw 50.586371 2.668816 La Rue
>>> des Lobes Rue des Lobes 50.482092 2.266353 La Rue des Fresnes Rue des
>>> Fresnes 50.477794 2.266416 La Rue du Moulin Rue du Moulin 50.579298
>>> 2.689841 La Rue de Saint Omer Rue de Saint-Omer 50.571286 2.697869 La
>>> Rue des Wirions Rue des Wirions 50.567841 2.733673 La Rue des Chavattes Rue
>>> des Chavattes 50.588666 2.697297 La Rue des Clabauts Rue des Clabauts
>>> 50.591284 2.697928 La Rue Picavet Rue Picavet 50.561432 2.706571 La Rue
>>> de Loisne Rue de Loisne 50.745894 3.13725 Rue de la Latte Rue de Latte
>>> 50.745894 3.13725 Rue de la Latte Rue de Latte 50.745894 3.13725 Rue de
>>> la Latte Rue de Latte 50.745894 3.13725 Rue de la Latte Rue de Latte
>>> 50.482092 2.266353 La Rue des Fresnes Rue des Fresnes 50.239255 2.441026 Au
>>> Chemin de Sombrin Chemin de Sombrin 50.36725 2.267188 La Chapelle De La
>>> Chapelle 50.591099 2.690511 La Rue du Rabat Rue du Rabat 50.567841
>>> 2.733673 La Rue des Chavattes Rue des Chavattes 50.586371 2.668816 La
>>> Rue des Lobes Rue des Lobes 50.638747 1.898124 Hameau de Dignopre Hameau
>>> de Dignopré 50.61245 1.740777 Route Nationale Route Nationale N°1
>>> 50.609524 1.74237 Route Nationale N°1 Route Nationale 50.600124 3.076128 Chemin
>>> des Margueritois Chemin des Margueritois / Chemin Rouge 50.27574
>>> 2.755416 La Rue de Fontaine Rue La Fontaine 50.26947 2.755188 La Rue
>>> Pasteur Rue Pasteur
>>>
>>>
>>> 2015-08-23 12:26 GMT+02:00 Christian Quest <cquest at openstreetmap.fr>:
>>>
>>>> Le 23/08/2015 11:30, Aurélien .... a écrit :
>>>>
>>>> Bonjour,
>>>>
>>>> Je m'intéresse de près à la BANO pour le moment spécifiquement dans le
>>>> Nord-Pas-De-Calais et à coups de requêtes dans tous les sens et j'ai pu
>>>> sortir des "différences" entre les données BANO et les données OSM.
>>>>
>>>>
>>>> As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait
>>>> justement le croisement BANO/OSM ?
>>>>
>>>> C'est une version "osmose" du rouge du rendu BANO, plus simple à
>>>> utiliser pour faire les corrections les unes après les autres.
>>>>
>>>> http://osmose.openstreetmap.fr/fr/errors/?item=7170 classes 30 à 33
>>>>
>>>>
>>>> J'en ai catalogué différents types :
>>>>
>>>> 1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges"
>>>> 2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de Guise"
>>>> 3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier Royal"
>>>>
>>>> Ce n'est pas bien méchant mais peut-être que nous pouvons établir un
>>>> ensemble de règles syntaxiques afin de créer un process de correction
>>>> automatique ?
>>>>
>>>>
>>>> Et comment déterminer qui est correct ? Les données BANO issues du
>>>> cadastres peuvent comporter des erreurs... le cadastre n'est pas parfait et
>>>> n'est pas une source d'autorité (c'est uniquement la commune qui l'est).
>>>>
>>>>
>>>> Il y a un quatrième type de différence qui est plus inquiétant, le
>>>> résultat ressemble à ça :
>>>>
>>>> - BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la Fontaine à
>>>> l'Tuerie" => hein est bien din ch'nord lô
>>>> - BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du Vieux Chemin
>>>> de Fourmies"
>>>> - BANO : "Rue Hector Sandrart" - OSM : "Rue Hector Sandrard"
>>>> - BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal Leclercq"
>>>>
>>>>
>>>> Certaines erreurs peuvent être éliminées en croisant avec encore plus
>>>> de données, typiquement sur les noms de personnes... Il n'y a pas de
>>>> "Général ou Maréchal Leclercq", Clemenceau ne comporte pas d'accent, etc...
>>>>
>>>> J'ai commencé à explorer cette piste, par l'extraction de tout les mots
>>>> uniques afin de créer un dictionnaire. Là aussi le dictionnaire aura besoin
>>>> d'être validé, le tout automatique me semble hasardeux.
>>>>
>>>> Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les name,
>>>> mais on pourrait reduire encore plus celui-ci en le spécialisant.
>>>>
>>>> En tout le nombre de "différences" sur la région s'élève à 1137 (en
>>>> comptant les "faux positifs") sur 110.000 rues.
>>>>
>>>> Est-ce que ça vous intéresserait d'avoir un listing groupé par commune
>>>> sur l'ensemble de la métropole afin d'avoir une base supplémentaire de
>>>> nettoyage ?
>>>>
>>>> Si c'est le cas, comment puis-je vous transmettre des fichiers CSV ?
>>>>
>>>> Je continue mes investigation pour checker s'il n'y aurait pas des rues
>>>> présentes dans la BANO et absentes dans OSM.
>>>>
>>>> Pardon par avance s'il y a déjà des outils qui existent pour faire ça.
>>>>
>>>> A bientôt
>>>>
>>>>
>>>>
>>>> Comment procèdes-tu pour sortir ce CSV ?
>>>>
>>>> --
>>>> Christian Quest - OpenStreetMap France
>>>>
>>>>
>>>> _______________________________________________
>>>> Talk-fr mailing list
>>>> Talk-fr at openstreetmap.org
>>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>>>
>>>>
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr at openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>>
>>>
>>
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>>
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20150823/54fbe860/attachment-0001.html>


Plus d'informations sur la liste de diffusion Talk-fr