<div dir="ltr"><div><font color="#674ea7"><span style="font-family:arial,sans-serif;font-size:13px">Au passage, si ça vient de la poste, c'est une base au format "adresse postale", sans accents, sans tirets etc... ?</span><br style="font-family:arial,sans-serif;font-size:13px"><br style="font-family:arial,sans-serif;font-size:13px"><span style="font-family:arial,sans-serif;font-size:13px">Qu'est-ce que je peste aussi contre ces absence dans le cadastre, particulièrement sur les majuscule. C'est une ancienne limite technique ?</span></font><br></div><div><br></div>C'est pas bien compliqué de contourner ce problème et de faire un rapprochement sur des chaines de caractères automatique. Perso, je fais ça en python. Je génére des slug (sorte d'identifiant unique texte) et je fais des comparaisons de nom entre sources de données différentes avant faire mes jointures attributaires. Ensuite j'isole les données des sources dans un sens comme dans l'autres pour voir ce qui n'a pas trouvé de correspondance (nom alternatif...) pour ensuite faire une deuxième passe...<div><br></div><div>J'avais même intégré cette fonction dans PostgreSQL en PL/Python<div><br></div><div>La technique consiste à avoir les mêmes caractères de séparation et la même case en ajoutant une fonction qui converti les caractères non ascii en caratère ascii ou/et supprime des caractères non souhaitait (comme des balise HTML). On peut même tester les correspondance de nom avec abréviation.</div></div><div><br></div><div>voir ce code <a href="https://gist.github.com/turicas/1428479">https://gist.github.com/turicas/1428479</a><br></div><div><br></div><div>Je pense qu'on pourrait aisément le faire pour l'ensemble des noms de rue en incluant aussi une table de clé de valeurs de remplacement au besoin (mais par commune car les prénoms peuvent être différent et l’abréviation identique...)</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">Le 1 octobre 2014 10:20, Stéphane Péneau <span dir="ltr"><<a href="mailto:stephane.peneau@wanadoo.fr" target="_blank">stephane.peneau@wanadoo.fr</a>></span> a écrit :<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Le 01/10/2014 06:35, Vincent de Château-Thierry a écrit :<span class=""><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Juste sur les n° temporaires du cadastre, il faut reconnaître qu'ils sont aussi dans BANO, car rien en apparence de les différencie des autres. On devrait pouvoir en détecter, ils sont souvent exprimés en milliers au milieu d'autres numéros en unités ou dizaines, dans la même voie, mais on ne s'est pas lancé là dedans pour l'instant.<br>
</blockquote>
<br></span>
Et filtrer les adresses isolées, à plusieurs kilomètres de la rue en question.<br>
<br>
Au passage, si ça vient de la poste, c'est une base au format "adresse postale", sans accents, sans tirets etc... ?<br>
<br>
Qu'est-ce que je peste aussi contre ces absence dans le cadastre, particulièrement sur les majuscule. C'est une ancienne limite technique ?<br>
<br>
<br>
Stf<div class="HOEnZb"><div class="h5"><br>
<br>
______________________________<u></u>_________________<br>
Talk-fr mailing list<br>
<a href="mailto:Talk-fr@openstreetmap.org" target="_blank">Talk-fr@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-fr" target="_blank">https://lists.openstreetmap.<u></u>org/listinfo/talk-fr</a><br>
</div></div></blockquote></div><br></div>