[OSM-talk-fr] [Nominatim] résultats non classés selon leur pertinence
Philippe Verdy
verdy_p at wanadoo.fr
Lun 18 Mar 14:22:03 UTC 2013
Le 18 mars 2013 14:37, Francescu GAROBY <windu.2b at gmail.com> a écrit :
> Je comprends bien le problème de l'homonymie, mais il y a tout de même une
> différence entre Caen et Caen : l'un est en admin_level=8 (la commune),
> l'autre en admin_level=7 (l'arrondissement). Et ça, ça devrait suffire à
> différencier les 2 relations et comprendre leur hiérarchie (l'une dans
> l'autre).
> Du coup, mettre en premier des rues qui sont dans l'arrondissement de Caen,
> avant celle qui se trouve dans la commune de Caen (et donc aussi dans
> l'arrondissement éponyme) me semble un bug plutôt facile à corriger, non ?
Je suis du même avis : quand on recherche quelquechose, la pertinence
doit prendre en compte dans la chaîne de recherche ce qui est les plus
pertinent, c'est à dire le plus local. Même s'il y a des homonymies
(et elles sont nombreuses étant donné que Nominatim est une base de
données mondiale).
Changer localement un nom pour "faire joli" dans les résultats de
Nominatim ne changera rien à l'ordre de tri des résultats (car même si
on a renommé en admin_level=7 "Caen" en "Arrondissement de Caen", cela
restera retourné malgré tout dans la recherche de "nom de rue, Caen"
(Nominatim fait une recherche globale des mots et n'a aucune idée d'où
couper, me^me si on a mis une virgule dans la chaîne de recherche,
d'autant plus qu'on peut rechercher sans mettre de majuscules, ni
d'accents ni aucune autre ponctuation, et que les résultats
"pertinents" doivent pourtant être classés (il n'y a pas de virgule
par exemple dans la base OSM qui stocke des noms séparés).
Nominatim utilise ausi d'autres critères pour la pertinence : pour
classer les villes il se base sur leur classification (city, town,
village,...) et si des données sont disponibles sur les chiffres de
population.
Actuellement le fait qu'il ait affiché les 3 résultats n'est pas une
anomalie en elle-même, c'est juste un problème de tri de la liste
retournée par pertinence (car Nominatim n'affiche pas toujours en une
seule requête tous les résultats possibles mais en retourne
quelques-uns selon leur degré de pertinence calculé, un degré de
pertinence qu'il affiche d'ailleurs dans ses résultats et tient compte
de divers tags, en donnant ensuite la possibilité à l'utilisateur de
chercher d'autres résultats "moins pertinents").
Plus d'informations sur la liste de diffusion Talk-fr