<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
<body text="#000000" bgcolor="#FFFFFF">
<div class="moz-cite-prefix">Le 21/06/2015 10:13, Christian Quest a
écrit :<br>
</div>
<blockquote class=" cite" id="mid_55867231_6000407_openstreetmap_fr"
cite="mid:55867231.6000407@openstreetmap.fr" type="cite">
<meta content="text/html; charset=utf-8" http-equiv="Content-Type">
Le 21/06/2015 07:26, Julien Noblet a écrit :<br>
<blockquote class=" cite"
id="mid_CACc__VGBNvE_RO38QauR4oOu_YgUhFVde6f__nt_YOU7_RrchA_mail_gmail_com"
cite="mid:CACc-_VGBNvE=RO38QauR4oOu=YgUhFVde6f-+nt-YOU7_RrchA@mail.gmail.com"
type="cite">
<meta http-equiv="Context-Type" content="text/html; ">
<div dir="ltr"><span>Bonjour,</span>
<div><br>
<div class="gmail_quote">
<div dir="ltr">Le sam. 20 juin 2015 à 17:01, Christian
Quest <<a moz-do-not-send="true"
href="mailto:cquest@openstreetmap.fr">cquest@openstreetmap.fr</a>>
a écrit :<br>
</div>
<blockquote id="Cite_5859996" class="gmail_quote cite">Petit
test très préliminaire d'addok contenant:<br>
- les adresses de la BAN<br>
- les POI extraits d'OSM<br>
<br>
C'est ici: <a moz-do-not-send="true"
href="http://osm.cquest.org/addok.html"
rel="noreferrer" target="_blank">http://osm.cquest.org/addok.html</a><br>
<br>
</blockquote>
<div>
<div>Super idée.</div>
<div>Quel est liste des catégories de POI extraits?</div>
</div>
</div>
</div>
</div>
</blockquote>
<br>
Je suis parti de la traduction du site OSM pour extraire une liste
de plus de 400 tags (traduits)<br>
C'est sûrement à affiner, je vais mettre ça au propre et sur
github.<br>
<br>
<a moz-do-not-send="true" class="moz-txt-link-freetext"
href="https://github.com/openstreetmap/openstreetmap-website/blob/master/config/locales/fr.yml">https://github.com/openstreetmap/openstreetmap-website/blob/master/config/locales/fr.yml</a><br>
<br>
J'ai attribué un "rank" (de 1 à 10) pour chaque type de POI,
histoire de classer les homonymes par ordre d'importance. Une gare
est plus importante qu'une gare routière, elle même plus
importante qu'un arrêt de bus, etc... c'est un peu subjectif et
difficile quand on est dans des thématique différentes (un hopital
est-il plus important qu'un musée ?)<br>
<br>
Pour certains types, il faut qu'il y ait un nom pour qu'ils soient
indexés, pour d'autres, le nom vide est remplacé par la traduction
du type de POI. Du coup on peut trouver une boulangerie, même si
il n'y a que shop=bakery et pas de name=*<br>
Je ne l'ai fait qu'à partir d'un certain rank, sinon chaque
lampadaire ou corbeille était indexé.<br>
Il y a encore sûrement pas mal de ménage à faire c'est un premier
jet.<br>
<br>
Plus de 400.000 POI ponctuels sont indexés et 900.000 en
surfacique (là il y a sûrement du ménage à faire) et très peu de
POI linéaires (1786).<br>
</blockquote>
Ce qui va rendre le truc puissant, c'est l'automatisation du rank
par des retours de recherche (genre bayésien). Une recherche sur
"SNCF" donnera un rank élevé à "Gare", comme synonyme, et moindre à
"point de vente".<br>
<br>
__<br>
FrViPofm<br>
</body>
</html>