[OSM-talk-fr] osmose : indice "confidence" ou comment faire le tri entre ce qui a besoin de vérif de ce qui n'en a pas besoin
marc marc
marc_marc_irc at hotmail.com
Sam 23 Déc 14:11:17 UTC 2017
Bonjour,
justement en parlant d'intégration, à cartomobilité, on a discuté cette
semaine entre autre de l'indice "confidence" et quelque chose nous
échappe. au point qu'on n'a pas trouvé comment l'utiliser.
exemple 1 : maj d'un monument historique
https://www.openstreetmap.org/way/111799738
https://osmose.openstreetmap.fr/fr/error/14890873491
indice confidence 0.94 localisé par le nom de la ville.
le fait que c'est localisé uniquement par la ville devrait donner un
mauvais taux de confiance.
le fait que c'est localisé dans osm avec un ref tendrait à avoir une
confiance parfaite.
le fait que les tag à mettre à jour ne sont pas en conflit tendrait
aussi à avoir un bon taux de confiance dans la maj
mhs:inscription_date = 2007 -> 2007-01-18
exemple 2 : maj d'un monument historique
https://www.openstreetmap.org/relation/1709140
https://osmose.openstreetmap.fr/fr/error/14890871852
indice confidence 0.23 localisé par le nom de la ville.
Il y a également une ref unique.
Quelle différence avec l'exemple 1 provoque une telle différence dans
l'indice de confiance ?
exemple 3 :
https://osmose.openstreetmap.fr/fr/error/14890868021
positioned at housenumber with confidence 0.35
Le fait que c'est localisé par le numéro de maison donne une meilleur
confiance dans la position géographique.
Mais l'objet a aussi une ref donc la position n'est-elle pas supposée
être "parfaite" ? ou en tout cas, on peux supposer qu'en l'absence de
conflit entre les données, le "match" entre la donnée opendata et la
donnée osm est parfait puisque basée sur une ref + donnée correcte de
l'adresse
exemple 4 :
https://osmose.openstreetmap.fr/fr/error/14891087879
pas d'indice de confiance pourtant on a la même phrase sur la méthode de
localisation utilisée.
exemple 5 : intégration d'un monument
https://osmose.openstreetmap.fr/fr/error/14890860331
Trois-Maries (rue des) 19, Lyon (positioned at city with confidence 0.18)
l'adresse est connue mais l'indice semble basée uniquement sur la ville.
pourtant l’adresse existe dans osn
https://www.openstreetmap.org/node/2809947300
Qu'est-ce qui fait qu'osmose n'utilise que la localisation de la ville
et pas celle de l'adresse ?
le match rate tant en position qu'en type d'objet.
si on flag en faux positif, la prochaine analyse testera-t-elle de
trouver un nouveau match ou plus de maj proposée pour cette intégration
opendata ?
exemple 6 :
https://osmose.openstreetmap.fr/fr/error/14890860273
positioned at housenumber with confidence 0.58
comment osmose fait-il puisqu'il n'y a pas encore ces adresse dans osm ?
d'ailleurs le match a raté (osmose a sélectionnée la muraille de la
ville au lieu d'un bâtiment entre les 2 rues en question).
On se posait par conséquent de nombreuses questions :
- comment est calculé cette indice de confiance ? uniquement à partir de
la localisation "adresse postale" dans le fichier opendata ? si oui pq
certains n'ont pas d'indice ?
- le taux le plus fiable c'est 0 ou 1 ? :-)
- lorsqu'il existe une ref, celle-ci est-elle utilisée ?
ou la ref sert juste à choisir la catégorie "mettre à jour" par rapport
à "intégration possible" ?
- cette indice de confiance est-il ou pas modulé en fonction de la
présence ou l'absence de conflit dans les maj proposée ? ou faudrait-il
un autre indice (fiabilité ?) pour cela ?
- est-il possible de filtrer sur ces 2 critères (fiabilité du match
osm<>opendata et fiabilité de la maj) ? tant dans l'interface web que l'api.
le but serrait par exemple de pouvoir lister tous les intégrations
"fiable" afin de proposer des opérations automatique très ciblée comme
par exemple faire un import des tag wheelchair sur les bureaux de poste
donc le match opendata<>osm est "parfait".
A l'inverse pouvoir sélectionner les cas nécessitant de la réflexion
serrait aussi utile (par exemple un bureau de poste qui aurait la ref
d'un bureau situé "trop loin" ou dont l'adresse est en conflit)
Cordialement,
Marc
Plus d'informations sur la liste de diffusion Talk-fr