<html>
  <head>
    <meta content="text/html; charset=utf-8" http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Le 23/08/2015 11:30, Aurélien .... a écrit :<br>
    <blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
      type="cite">
      <meta http-equiv="Context-Type" content="text/html; charset=UTF-8">
      <div dir="ltr">Bonjour,
        <div><br>
        </div>
        <div>Je m'intéresse de près à la BANO pour le moment
          spécifiquement dans le Nord-Pas-De-Calais et à coups de
          requêtes dans tous les sens et j'ai pu sortir des
          "différences" entre les données BANO et les données OSM.</div>
        <div><br>
        </div>
      </div>
    </blockquote>
    <br>
    As tu regardé la dernière analyse Osmose que j'ai ajouté qui fait
    justement le croisement BANO/OSM ?<br>
    <br>
    C'est une version "osmose" du rouge du rendu BANO, plus simple à
    utiliser pour faire les corrections les unes après les autres.<br>
    <br>
    <a class="moz-txt-link-freetext" href="http://osmose.openstreetmap.fr/fr/errors/?item=7170">http://osmose.openstreetmap.fr/fr/errors/?item=7170</a> classes 30 à 33<br>
    <br>
    <br>
    <blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div>J'en ai catalogué différents types :</div>
        <div><br>
        </div>
        <div>1) BANO : "La rue des Mésanges" - OSM : "Rue des mésanges"</div>
        <div>2) BANO : "L'Arbre de Guise" - OSM : "Rue de l'Arbre de
          Guise"</div>
        <div>3) BANO : "Rue de l'Escalier Royal" - OSM : "Escalier
          Royal"</div>
        <div><br>
        </div>
        <div>Ce n'est pas bien méchant mais peut-être que nous pouvons
          établir un ensemble de règles syntaxiques afin de créer un
          process de correction automatique ?</div>
        <div><br>
        </div>
      </div>
    </blockquote>
    <br>
    Et comment déterminer qui est correct ? Les données BANO issues du
    cadastres peuvent comporter des erreurs... le cadastre n'est pas
    parfait et n'est pas une source d'autorité (c'est uniquement la
    commune qui l'est).<br>
    <br>
    <br>
    <blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div>Il y a un quatrième type de différence qui est plus
          inquiétant, le résultat ressemble à ça :</div>
        <div><br>
        </div>
        <div>- BANO : "Rue de la Fontaine Al Tuerie" - OSM : "Rue de la
          Fontaine à l'Tuerie" => hein est bien din ch'nord lô</div>
        <div>- BANO : "Rue du Vieux Chemin de Fourmie"" - OSM : "Rue du
          Vieux Chemin de Fourmies"</div>
        <div>- BANO : "Rue Hector Sandrart" - OSM : "Rue Hector
          Sandrard"</div>
        <div>- BANO : "Rue du Maréchal Leclerc" - OSM : "Rue du Maréchal
          Leclercq"</div>
        <div><br>
        </div>
      </div>
    </blockquote>
    <br>
    Certaines erreurs peuvent être éliminées en croisant avec encore
    plus de données, typiquement sur les noms de personnes... Il n'y a
    pas de "Général ou Maréchal Leclercq", Clemenceau ne comporte pas
    d'accent, etc...<br>
    <br>
    J'ai commencé à explorer cette piste, par l'extraction de tout les
    mots uniques afin de créer un dictionnaire. Là aussi le dictionnaire
    aura besoin d'être validé, le tout automatique me semble hasardeux.<br>
    <br>
    Il y a déjà un dictionnaire utilisé par l'analyse osmose sur les
    name, mais on pourrait reduire encore plus celui-ci en le
    spécialisant.<br>
    <br>
    <blockquote
cite="mid:CAJ5x_YN1BFA6nWNJ5fAQFY2D_si_z_jf29ATZSTN=6J4yvyBUw@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div>En tout le nombre de "différences" sur la région s'élève à
          1137 (en comptant les "faux positifs") sur 110.000 rues.</div>
        <div><br>
        </div>
        <div>Est-ce que ça vous intéresserait d'avoir un listing groupé
          par commune sur l'ensemble de la métropole afin d'avoir une
          base supplémentaire de nettoyage ?</div>
        <div><br>
        </div>
        <div>Si c'est le cas, comment puis-je vous transmettre des
          fichiers CSV ?</div>
        <div><br>
        </div>
        <div>Je continue mes investigation pour checker s'il n'y aurait
          pas des rues présentes dans la BANO et absentes dans OSM.</div>
        <div><br>
        </div>
        <div>Pardon par avance s'il y a déjà des outils qui existent
          pour faire ça.</div>
        <div><br>
        </div>
        <div>A bientôt</div>
        <br>
      </div>
    </blockquote>
    <br>
    <br>
    Comment procèdes-tu pour sortir ce CSV ?<br>
    <br>
    <pre class="moz-signature" cols="72">-- 
Christian Quest - OpenStreetMap France</pre>
  </body>
</html>