[OSM-talk-fr] osmose : indice "confidence" ou comment faire le tri entre ce qui a besoin de vérif de ce qui n'en a pas besoin
Frédéric Rodrigo
fred.rodrigo at gmail.com
Lun 25 Déc 10:14:54 UTC 2017
L'indice de confiance est juste le score retourné par le géocodeur addok
sur la base de la BAN.
Le score ne tient pas compte du niveau du résultat (ville, rues, numéro
de rue), mais de la proximité de la chaine géocodé avec celle du
résultat. Si je demande "Paris", je vais avoir "Paris" en retour avec un
très bon score, ce n'est pas pour autant précis.
Frédéric.
Le 23/12/2017 à 15:36, PanierAvide a écrit :
> Bonjour Marc,
>
> En creusant un peu, quelques pistes de réponses sur l'indice
> confidence. Le code source ici de l'analyse Osmose [1] semble montrer
> que le géocodage est fait via l'API adresse.data.gouv.fr. L'info
> affichée "confidence" est donc uniquement basée sur le géocodage. Et
> le calcul de cet indice n'est pas décrit, mais est normé entre 0 et 1
> (voir [2]), à priori en ayant une valeur élevée pour une bonne qualité
> de géocodage.
>
> Cordialement,
>
> Adrien.
>
> [1]
> https://github.com/osm-fr/osmose-backend/blob/f43564d78f590a7d3fd9493bbf2f720a0a9379c4/analysers/analyser_merge_heritage_FR_merimee.py
> [2] https://adresse.data.gouv.fr/api/
>
> Le 23/12/2017 à 15:11, marc marc a écrit :
>> Bonjour,
>>
>> justement en parlant d'intégration, à cartomobilité, on a discuté cette
>> semaine entre autre de l'indice "confidence" et quelque chose nous
>> échappe. au point qu'on n'a pas trouvé comment l'utiliser.
>>
>> exemple 1 : maj d'un monument historique
>> https://www.openstreetmap.org/way/111799738
>> https://osmose.openstreetmap.fr/fr/error/14890873491
>> indice confidence 0.94 localisé par le nom de la ville.
>> le fait que c'est localisé uniquement par la ville devrait donner un
>> mauvais taux de confiance.
>> le fait que c'est localisé dans osm avec un ref tendrait à avoir une
>> confiance parfaite.
>> le fait que les tag à mettre à jour ne sont pas en conflit tendrait
>> aussi à avoir un bon taux de confiance dans la maj
>> mhs:inscription_date = 2007 -> 2007-01-18
>>
>> exemple 2 : maj d'un monument historique
>> https://www.openstreetmap.org/relation/1709140
>> https://osmose.openstreetmap.fr/fr/error/14890871852
>> indice confidence 0.23 localisé par le nom de la ville.
>> Il y a également une ref unique.
>> Quelle différence avec l'exemple 1 provoque une telle différence dans
>> l'indice de confiance ?
>>
>> exemple 3 :
>> https://osmose.openstreetmap.fr/fr/error/14890868021
>> positioned at housenumber with confidence 0.35
>> Le fait que c'est localisé par le numéro de maison donne une meilleur
>> confiance dans la position géographique.
>> Mais l'objet a aussi une ref donc la position n'est-elle pas supposée
>> être "parfaite" ? ou en tout cas, on peux supposer qu'en l'absence de
>> conflit entre les données, le "match" entre la donnée opendata et la
>> donnée osm est parfait puisque basée sur une ref + donnée correcte de
>> l'adresse
>>
>> exemple 4 :
>> https://osmose.openstreetmap.fr/fr/error/14891087879
>> pas d'indice de confiance pourtant on a la même phrase sur la méthode de
>> localisation utilisée.
>>
>> exemple 5 : intégration d'un monument
>> https://osmose.openstreetmap.fr/fr/error/14890860331
>> Trois-Maries (rue des) 19, Lyon (positioned at city with confidence
>> 0.18)
>> l'adresse est connue mais l'indice semble basée uniquement sur la ville.
>> pourtant l’adresse existe dans osn
>> https://www.openstreetmap.org/node/2809947300
>> Qu'est-ce qui fait qu'osmose n'utilise que la localisation de la ville
>> et pas celle de l'adresse ?
>> le match rate tant en position qu'en type d'objet.
>> si on flag en faux positif, la prochaine analyse testera-t-elle de
>> trouver un nouveau match ou plus de maj proposée pour cette intégration
>> opendata ?
>>
>> exemple 6 :
>> https://osmose.openstreetmap.fr/fr/error/14890860273
>> positioned at housenumber with confidence 0.58
>> comment osmose fait-il puisqu'il n'y a pas encore ces adresse dans osm ?
>> d'ailleurs le match a raté (osmose a sélectionnée la muraille de la
>> ville au lieu d'un bâtiment entre les 2 rues en question).
>>
>> On se posait par conséquent de nombreuses questions :
>> - comment est calculé cette indice de confiance ? uniquement à partir de
>> la localisation "adresse postale" dans le fichier opendata ? si oui pq
>> certains n'ont pas d'indice ?
>> - le taux le plus fiable c'est 0 ou 1 ? :-)
>> - lorsqu'il existe une ref, celle-ci est-elle utilisée ?
>> ou la ref sert juste à choisir la catégorie "mettre à jour" par rapport
>> à "intégration possible" ?
>> - cette indice de confiance est-il ou pas modulé en fonction de la
>> présence ou l'absence de conflit dans les maj proposée ? ou faudrait-il
>> un autre indice (fiabilité ?) pour cela ?
>> - est-il possible de filtrer sur ces 2 critères (fiabilité du match
>> osm<>opendata et fiabilité de la maj) ? tant dans l'interface web que
>> l'api.
>>
>> le but serrait par exemple de pouvoir lister tous les intégrations
>> "fiable" afin de proposer des opérations automatique très ciblée comme
>> par exemple faire un import des tag wheelchair sur les bureaux de poste
>> donc le match opendata<>osm est "parfait".
>> A l'inverse pouvoir sélectionner les cas nécessitant de la réflexion
>> serrait aussi utile (par exemple un bureau de poste qui aurait la ref
>> d'un bureau situé "trop loin" ou dont l'adresse est en conflit)
>>
>> Cordialement,
>> Marc
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
Plus d'informations sur la liste de diffusion Talk-fr