<html>
<head>
<meta content="text/html; charset=utf-8" http-equiv="Content-Type">
</head>
<body bgcolor="#FFFFFF" text="#000000">
Le 23/08/2015 11:30, Aurélien .... a écrit :<br>
<blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
type="cite">
<meta http-equiv="Context-Type" content="text/html; charset=UTF-8">
<div dir="ltr">Bonjour,
<div><br>
</div>
<div>Je m'intéresse de près à la BANO pour le moment
spécifiquement dans le Nord-Pas-De-Calais et à coups de
requêtes dans tous les sens et j'ai pu sortir des
"différences" entre les données BANO et les données OSM.</div>
<div><br>
</div>
</div>
</blockquote>
<br>
As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait
justement le croisement BANO/OSM ?<br>
<br>
C'est une version "osmose" du rouge du rendu BANO, plus simple à
utiliser pour faire les corrections les unes après les autres.<br>
<br>
<a class="moz-txt-link-freetext" href="http://osmose.openstreetmap.fr/fr/errors/?item=7170">http://osmose.openstreetmap.fr/fr/errors/?item=7170</a> classes 30 à 33<br>
<br>
<br>
<blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
type="cite">
<div dir="ltr">
<div>J'en ai catalogué différents types :</div>
<div><br>
</div>
<div>1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges"</div>
<div>2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de
Guise"</div>
<div>3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier
Royal"</div>
<div><br>
</div>
<div>Ce n'est pas bien méchant mais peut-être que nous pouvons
établir un ensemble de règles syntaxiques afin de créer un
process de correction automatique ?</div>
<div><br>
</div>
</div>
</blockquote>
<br>
Et comment déterminer qui est correct ? Les données BANO issues du
cadastres peuvent comporter des erreurs... le cadastre n'est pas
parfait et n'est pas une source d'autorité (c'est uniquement la
commune qui l'est).<br>
<br>
<br>
<blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
type="cite">
<div dir="ltr">
<div>Il y a un quatrième type de différence qui est plus
inquiétant, le résultat ressemble à ça :</div>
<div><br>
</div>
<div>- BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la
Fontaine à l'Tuerie" => hein est bien din ch'nord lô</div>
<div>- BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du
Vieux Chemin de Fourmies"</div>
<div>- BANO : "Rue Hector Sandrart" - OSM : "Rue Hector
Sandrard"</div>
<div>- BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal
Leclercq"</div>
<div><br>
</div>
</div>
</blockquote>
<br>
Certaines erreurs peuvent être éliminées en croisant avec encore
plus de données, typiquement sur les noms de personnes... Il n'y a
pas de "Général ou Maréchal Leclercq", Clemenceau ne comporte pas
d'accent, etc...<br>
<br>
J'ai commencé à explorer cette piste, par l'extraction de tout les
mots uniques afin de créer un dictionnaire. Là aussi le dictionnaire
aura besoin d'être validé, le tout automatique me semble hasardeux.<br>
<br>
Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les
name, mais on pourrait reduire encore plus celui-ci en le
spécialisant.<br>
<br>
<blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
type="cite">
<div dir="ltr">
<div>En tout le nombre de "différences" sur la région s'élève à
1137 (en comptant les "faux positifs") sur 110.000 rues.</div>
<div><br>
</div>
<div>Est-ce que ça vous intéresserait d'avoir un listing groupé
par commune sur l'ensemble de la métropole afin d'avoir une
base supplémentaire de nettoyage ?</div>
<div><br>
</div>
<div>Si c'est le cas, comment puis-je vous transmettre des
fichiers CSV ?</div>
<div><br>
</div>
<div>Je continue mes investigation pour checker s'il n'y aurait
pas des rues présentes dans la BANO et absentes dans OSM.</div>
<div><br>
</div>
<div>Pardon par avance s'il y a déjà des outils qui existent
pour faire ça.</div>
<div><br>
</div>
<div>A bientôt</div>
<br>
</div>
</blockquote>
<br>
<br>
Comment procèdes-tu pour sortir ce CSV ?<br>
<br>
<pre class="moz-signature" cols="72">--
Christian Quest - OpenStreetMap France</pre>
</body>
</html>