[OSM-talk-fr] BANO VS OSM

Christian Quest cquest at openstreetmap.fr
Dim 23 Aou 10:26:42 UTC 2015


Le 23/08/2015 11:30, Aurélien .... a écrit :
> Bonjour,
>
> Je m'intéresse de près à la BANO pour le moment spécifiquement dans le
> Nord-Pas-De-Calais et à coups de requêtes dans tous les sens et j'ai
> pu sortir des "différences" entre les données BANO et les données OSM.
>

As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait
justement le croisement BANO/OSM ?

C'est une version "osmose" du rouge du rendu BANO, plus simple à
utiliser pour faire les corrections les unes après les autres.

http://osmose.openstreetmap.fr/fr/errors/?item=7170 classes 30 à 33


> J'en ai catalogué différents types :
>
> 1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges"
> 2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de Guise"
> 3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier Royal"
>
> Ce n'est pas bien méchant mais peut-être que nous pouvons établir un
> ensemble de règles syntaxiques afin de créer un process de correction
> automatique ?
>

Et comment déterminer qui est correct ? Les données BANO issues du
cadastres peuvent comporter des erreurs... le cadastre n'est pas parfait
et n'est pas une source d'autorité (c'est uniquement la commune qui l'est).


> Il y a un quatrième type de différence qui est plus inquiétant, le
> résultat ressemble à ça :
>
> - BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la Fontaine à
> l'Tuerie" => hein est bien din ch'nord lô
> - BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du Vieux
> Chemin de Fourmies"
> - BANO : "Rue Hector Sandrart" - OSM : "Rue Hector Sandrard"
> - BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal Leclercq"
>

Certaines erreurs peuvent être éliminées en croisant avec encore plus de
données, typiquement sur les noms de personnes... Il n'y a pas de
"Général ou Maréchal Leclercq", Clemenceau ne comporte pas d'accent, etc...

J'ai commencé à explorer cette piste, par l'extraction de tout les mots
uniques afin de créer un dictionnaire. Là aussi le dictionnaire aura
besoin d'être validé, le tout automatique me semble hasardeux.

Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les name,
mais on pourrait reduire encore plus celui-ci en le spécialisant.

> En tout le nombre de "différences" sur la région s'élève à 1137 (en
> comptant les "faux positifs") sur 110.000 rues.
>
> Est-ce que ça vous intéresserait d'avoir un listing groupé par commune
> sur l'ensemble de la métropole afin d'avoir une base supplémentaire de
> nettoyage ?
>
> Si c'est le cas, comment puis-je vous transmettre des fichiers CSV ?
>
> Je continue mes investigation pour checker s'il n'y aurait pas des
> rues présentes dans la BANO et absentes dans OSM.
>
> Pardon par avance s'il y a déjà des outils qui existent pour faire ça.
>
> A bientôt
>


Comment procèdes-tu pour sortir ce CSV ?

-- 
Christian Quest - OpenStreetMap France

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20150823/92a7ca30/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr