[OSM-talk-fr] osmose : indice "confidence" ou comment faire le tri entre ce qui a besoin de vérif de ce qui n'en a pas besoin

PanierAvide panieravide at riseup.net
Sam 23 Déc 14:36:36 UTC 2017


Bonjour Marc,

En creusant un peu, quelques pistes de réponses sur l'indice confidence. 
Le code source ici de l'analyse Osmose [1] semble montrer que le 
géocodage est fait via l'API adresse.data.gouv.fr. L'info affichée 
"confidence" est donc uniquement basée sur le géocodage. Et le calcul de 
cet indice n'est pas décrit, mais est normé entre 0 et 1 (voir [2]), à 
priori en ayant une valeur élevée pour une bonne qualité de géocodage.

Cordialement,

Adrien.

[1] 
https://github.com/osm-fr/osmose-backend/blob/f43564d78f590a7d3fd9493bbf2f720a0a9379c4/analysers/analyser_merge_heritage_FR_merimee.py
[2] https://adresse.data.gouv.fr/api/

Le 23/12/2017 à 15:11, marc marc a écrit :
> Bonjour,
>
> justement en parlant d'intégration, à cartomobilité, on a discuté cette
> semaine entre autre de l'indice "confidence" et quelque chose nous
> échappe. au point qu'on n'a pas trouvé comment l'utiliser.
>
> exemple 1 : maj d'un monument historique
> https://www.openstreetmap.org/way/111799738
> https://osmose.openstreetmap.fr/fr/error/14890873491
> indice confidence 0.94 localisé par le nom de la ville.
> le fait que c'est localisé uniquement par la ville devrait donner un
> mauvais taux de confiance.
> le fait que c'est localisé dans osm avec un ref tendrait à avoir une
> confiance parfaite.
> le fait que les tag à mettre à jour ne sont pas en conflit tendrait
> aussi à avoir un bon taux de confiance dans la maj
> mhs:inscription_date = 2007 -> 2007-01-18
>
> exemple 2 : maj d'un monument historique
> https://www.openstreetmap.org/relation/1709140
> https://osmose.openstreetmap.fr/fr/error/14890871852
> indice confidence 0.23 localisé par le nom de la ville.
> Il y a également une ref unique.
> Quelle différence avec l'exemple 1 provoque une telle différence dans
> l'indice de confiance ?
>
> exemple 3 :
> https://osmose.openstreetmap.fr/fr/error/14890868021
> positioned at housenumber with confidence 0.35
> Le fait que c'est localisé par le numéro de maison donne une meilleur
> confiance dans la position géographique.
> Mais l'objet a aussi une ref donc la position n'est-elle pas supposée
> être "parfaite" ? ou en tout cas, on peux supposer qu'en l'absence de
> conflit entre les données, le "match" entre la donnée opendata et la
> donnée osm est parfait puisque basée sur une ref + donnée correcte de
> l'adresse
>
> exemple 4 :
> https://osmose.openstreetmap.fr/fr/error/14891087879
> pas d'indice de confiance pourtant on a la même phrase sur la méthode de
> localisation utilisée.
>
> exemple 5 : intégration d'un monument
> https://osmose.openstreetmap.fr/fr/error/14890860331
> Trois-Maries (rue des) 19, Lyon (positioned at city with confidence 0.18)
> l'adresse est connue mais l'indice semble basée uniquement sur la ville.
> pourtant l’adresse existe dans osn
> https://www.openstreetmap.org/node/2809947300
> Qu'est-ce qui fait qu'osmose n'utilise que la localisation de la ville
> et pas celle de l'adresse ?
> le match rate tant en position qu'en type d'objet.
> si on flag en faux positif, la prochaine analyse testera-t-elle de
> trouver un nouveau match ou plus de maj proposée pour cette intégration
> opendata ?
>
> exemple 6 :
> https://osmose.openstreetmap.fr/fr/error/14890860273
> positioned at housenumber with confidence 0.58
> comment osmose fait-il puisqu'il n'y a pas encore ces adresse dans osm ?
> d'ailleurs le match a raté (osmose a sélectionnée la muraille de la
> ville au lieu d'un bâtiment entre les 2 rues en question).
>
> On se posait par conséquent de nombreuses questions :
> - comment est calculé cette indice de confiance ? uniquement à partir de
> la localisation "adresse postale" dans le fichier opendata ? si oui pq
> certains n'ont pas d'indice ?
> - le taux le plus fiable c'est 0 ou 1 ? :-)
> - lorsqu'il existe une ref, celle-ci est-elle utilisée ?
> ou la ref sert juste à choisir la catégorie "mettre à jour" par rapport
> à "intégration possible" ?
> - cette indice de confiance est-il ou pas modulé en fonction de la
> présence ou l'absence de conflit dans les maj proposée ? ou faudrait-il
> un autre indice (fiabilité ?) pour cela ?
> - est-il possible de filtrer sur ces 2 critères (fiabilité du match
> osm<>opendata et fiabilité de la maj) ? tant dans l'interface web que l'api.
>
> le but serrait par exemple de pouvoir lister tous les intégrations
> "fiable" afin de proposer des opérations automatique très ciblée comme
> par exemple faire un import des tag wheelchair sur les bureaux de poste
> donc le match opendata<>osm est "parfait".
> A l'inverse pouvoir sélectionner les cas nécessitant de la réflexion
> serrait aussi utile (par exemple un bureau de poste qui aurait la ref
> d'un bureau situé "trop loin" ou dont l'adresse est en conflit)
>
> Cordialement,
> Marc
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr


-- 
PanierAvide
Géomaticien & développeur





Plus d'informations sur la liste de diffusion Talk-fr