<div dir="ltr">Je peux grouper par commune, où puis-je te transmettre ces infos ? Puis-je ajouter une pièce jointe à cette liste ?<div><br></div><div>Je ferai ça pour ce soir ou demain soir au pire des cas.</div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-08-23 13:51 GMT+02:00 adrien carpentier <span dir="ltr"><<a href="mailto:ad.carpentier@gmail.com" target="_blank">ad.carpentier@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div>Salut!<br></div>pour info, on a pris le taureau par les cornes sur le npdc,nous en discutons sur la liste locale en général :<br><a href="http://listes.openstreetmap.fr/wws/info/local-npdc" target="_blank">http://listes.openstreetmap.fr/wws/info/local-npdc</a><br>et bruno a développé un site d'analyses : <br><a href="http://legosm.fr/bano5962/evolution.html" target="_blank">http://legosm.fr/bano5962/evolution.html</a><br></div>pour info, nous avons les 2 plus gros départements de France en terme d'adresses (et donc de rapprochements osm/bano) :<br><a href="https://openstreetmap.fr/outils/bano/status" target="_blank">https://openstreetmap.fr/outils/bano/status</a><br></div>par contre, nous fonctionnons plutôt par commune que par type d'erreurs, mais si tes analyses nous permettent d'avancer plus vite, on es bien sur preneurs...<br>@+<span class="HOEnZb"><font color="#888888"><br></font></span></div><span class="HOEnZb"><font color="#888888">adrien<br><div><div><div><div><pre><br><br></pre><br></div></div></div></div></font></span></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">Le 23 août 2015 13:37, Aurélien .... <span dir="ltr"><<a href="mailto:kinju59@gmail.com" target="_blank">kinju59@gmail.com</a>></span> a écrit :<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Non je n'ai pas regardé la dernière analyse, je ne suis pas très à jour avec les outils proposés.<div><br></div><div>Je pense que pour distinguer ce qui est correct ou non d'une source ou de l'autre il faut passer par du cas mais que l'on peut amoindrir l'effort humain en définissant des règles syntaxiques (expressions régulières) afin de gérer des "La rue de" et "Rue de" ou "Mésanges" et "Rue des Mésanges" afin de diminuer l'effort humain et qu'il se concentre sur les "problèmes" du 4ème type.</div><div><br></div><div>La part de distinction est petite par rapport à la volumétrie mais c'est toujours irritant et très impactant dans le jugement d'une source de données lorsque celle-ci comporte des fautes de reproduction, grammaire ou orthographe. Ce n'est pas une critique, juste un avis ;)</div><div><br></div><div>Pour les fichiers CSV, j'ai importé d'un côté les données OSM, d'un autre mes données BANO et ai effectué des requêtes PostgreSQL pour le rapprochement. Sous PgAdmin le "copier" du résultat est sous format CSV.</div><div><br></div><div>Les premières lignes de "différences" :</div><div><br></div><div><table style="border-collapse:collapse;width:609pt" border="0" cellpadding="0" cellspacing="0" width="812">
<colgroup><col style="width:60pt" width="80">
<col style="width:80pt" width="107">
<col style="width:233pt" width="310">
<col style="width:236pt" width="315">
</colgroup><tbody><tr style="height:15pt" height="20">
<td style="height:15pt;width:60pt" height="20" width="80">Lati</td>
<td style="width:80pt" width="107">Longi</td>
<td style="width:233pt" width="310">BANO</td>
<td style="width:236pt" width="315">OSM</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.478027</td>
<td>2.258851</td>
<td>La Rue Guilbert</td>
<td>Rue Guilbert</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.16838</td>
<td>3.881105</td>
<td>Rue de la Queue Noir Jean</td>
<td>Rue de la Queue Noire Jean</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745565</td>
<td>3.104056</td>
<td>Avenue Ponthieux</td>
<td>Avenue Ponthieu</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.735717</td>
<td>3.121181</td>
<td>Rue Jules Watteuw</td>
<td>Rue Jules Watteeuw</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.586371</td>
<td>2.668816</td>
<td>La Rue des Lobes</td>
<td>Rue des Lobes</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.482092</td>
<td>2.266353</td>
<td>La Rue des Fresnes</td>
<td>Rue des Fresnes</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.477794</td>
<td>2.266416</td>
<td>La Rue du Moulin</td>
<td>Rue du Moulin</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.579298</td>
<td>2.689841</td>
<td>La Rue de Saint Omer</td>
<td>Rue de Saint-Omer</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.571286</td>
<td>2.697869</td>
<td>La Rue des Wirions</td>
<td>Rue des Wirions</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.567841</td>
<td>2.733673</td>
<td>La Rue des Chavattes</td>
<td>Rue des Chavattes</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.588666</td>
<td>2.697297</td>
<td>La Rue des Clabauts</td>
<td>Rue des Clabauts</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.591284</td>
<td>2.697928</td>
<td>La Rue Picavet</td>
<td>Rue Picavet</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.561432</td>
<td>2.706571</td>
<td>La Rue de Loisne</td>
<td>Rue de Loisne</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.745894</td>
<td>3.13725</td>
<td>Rue de la Latte</td>
<td>Rue de Latte</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.482092</td>
<td>2.266353</td>
<td>La Rue des Fresnes</td>
<td>Rue des Fresnes</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.239255</td>
<td>2.441026</td>
<td>Au Chemin de Sombrin</td>
<td>Chemin de Sombrin</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.36725</td>
<td>2.267188</td>
<td>La Chapelle</td>
<td>De La Chapelle</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.591099</td>
<td>2.690511</td>
<td>La Rue du Rabat</td>
<td>Rue du Rabat</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.567841</td>
<td>2.733673</td>
<td>La Rue des Chavattes</td>
<td>Rue des Chavattes</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.586371</td>
<td>2.668816</td>
<td>La Rue des Lobes</td>
<td>Rue des Lobes</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.638747</td>
<td>1.898124</td>
<td>Hameau de Dignopre</td>
<td>Hameau de Dignopré</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.61245</td>
<td>1.740777</td>
<td>Route Nationale</td>
<td>Route Nationale N°1</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.609524</td>
<td>1.74237</td>
<td>Route Nationale N°1</td>
<td>Route Nationale</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.600124</td>
<td>3.076128</td>
<td>Chemin des Margueritois</td>
<td>Chemin des Margueritois / Chemin Rouge</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.27574</td>
<td>2.755416</td>
<td>La Rue de Fontaine</td>
<td>Rue La Fontaine</td>
</tr>
<tr style="height:15pt" height="20">
<td style="height:15pt" height="20">50.26947</td>
<td>2.755188</td>
<td>La Rue Pasteur</td>
<td>Rue Pasteur</td>
</tr></tbody></table></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote"><div><div>2015-08-23 12:26 GMT+02:00 Christian Quest <span dir="ltr"><<a href="mailto:cquest@openstreetmap.fr" target="_blank">cquest@openstreetmap.fr</a>></span>:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>
<div bgcolor="#FFFFFF" text="#000000"><span>
Le 23/08/2015 11:30, Aurélien .... a écrit :<br>
<blockquote type="cite">
<div dir="ltr">Bonjour,
<div><br>
</div>
<div>Je m'intéresse de près à la BANO pour le moment
spécifiquement dans le Nord-Pas-De-Calais et à coups de
requêtes dans tous les sens et j'ai pu sortir des
"différences" entre les données BANO et les données OSM.</div>
<div><br>
</div>
</div>
</blockquote>
<br></span>
As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait
justement le croisement BANO/OSM ?<br>
<br>
C'est une version "osmose" du rouge du rendu BANO, plus simple à
utiliser pour faire les corrections les unes après les autres.<br>
<br>
<a href="http://osmose.openstreetmap.fr/fr/errors/?item=7170" target="_blank">http://osmose.openstreetmap.fr/fr/errors/?item=7170</a> classes 30 à 33<span><br>
<br>
<br>
<blockquote type="cite">
<div dir="ltr">
<div>J'en ai catalogué différents types :</div>
<div><br>
</div>
<div>1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges"</div>
<div>2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de
Guise"</div>
<div>3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier
Royal"</div>
<div><br>
</div>
<div>Ce n'est pas bien méchant mais peut-être que nous pouvons
établir un ensemble de règles syntaxiques afin de créer un
process de correction automatique ?</div>
<div><br>
</div>
</div>
</blockquote>
<br></span>
Et comment déterminer qui est correct ? Les données BANO issues du
cadastres peuvent comporter des erreurs... le cadastre n'est pas
parfait et n'est pas une source d'autorité (c'est uniquement la
commune qui l'est).<span><br>
<br>
<br>
<blockquote type="cite">
<div dir="ltr">
<div>Il y a un quatrième type de différence qui est plus
inquiétant, le résultat ressemble à ça :</div>
<div><br>
</div>
<div>- BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la
Fontaine à l'Tuerie" => hein est bien din ch'nord lô</div>
<div>- BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du
Vieux Chemin de Fourmies"</div>
<div>- BANO : "Rue Hector Sandrart" - OSM : "Rue Hector
Sandrard"</div>
<div>- BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal
Leclercq"</div>
<div><br>
</div>
</div>
</blockquote>
<br></span>
Certaines erreurs peuvent être éliminées en croisant avec encore
plus de données, typiquement sur les noms de personnes... Il n'y a
pas de "Général ou Maréchal Leclercq", Clemenceau ne comporte pas
d'accent, etc...<br>
<br>
J'ai commencé à explorer cette piste, par l'extraction de tout les
mots uniques afin de créer un dictionnaire. Là aussi le dictionnaire
aura besoin d'être validé, le tout automatique me semble hasardeux.<br>
<br>
Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les
name, mais on pourrait reduire encore plus celui-ci en le
spécialisant.<span><br>
<br>
<blockquote type="cite">
<div dir="ltr">
<div>En tout le nombre de "différences" sur la région s'élève à
1137 (en comptant les "faux positifs") sur 110.000 rues.</div>
<div><br>
</div>
<div>Est-ce que ça vous intéresserait d'avoir un listing groupé
par commune sur l'ensemble de la métropole afin d'avoir une
base supplémentaire de nettoyage ?</div>
<div><br>
</div>
<div>Si c'est le cas, comment puis-je vous transmettre des
fichiers CSV ?</div>
<div><br>
</div>
<div>Je continue mes investigation pour checker s'il n'y aurait
pas des rues présentes dans la BANO et absentes dans OSM.</div>
<div><br>
</div>
<div>Pardon par avance s'il y a déjà des outils qui existent
pour faire ça.</div>
<div><br>
</div>
<div>A bientôt</div>
<br>
</div>
</blockquote>
<br>
<br></span>
Comment procèdes-tu pour sortir ce CSV ?<span><font color="#888888"><br>
<br>
<pre cols="72">--
Christian Quest - OpenStreetMap France</pre>
</font></span></div>
<br></div></div>_______________________________________________<br>
Talk-fr mailing list<br>
<a href="mailto:Talk-fr@openstreetmap.org" target="_blank">Talk-fr@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-fr" rel="noreferrer" target="_blank">https://lists.openstreetmap.org/listinfo/talk-fr</a><br>
<br></blockquote></div><br></div>
<br>_______________________________________________<br>
Talk-fr mailing list<br>
<a href="mailto:Talk-fr@openstreetmap.org" target="_blank">Talk-fr@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-fr" rel="noreferrer" target="_blank">https://lists.openstreetmap.org/listinfo/talk-fr</a><br>
<br></blockquote></div><br></div>
</div></div><br>_______________________________________________<br>
Talk-fr mailing list<br>
<a href="mailto:Talk-fr@openstreetmap.org">Talk-fr@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-fr" rel="noreferrer" target="_blank">https://lists.openstreetmap.org/listinfo/talk-fr</a><br>
<br></blockquote></div><br></div>