[OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

Yves P. yves.pratter at gmail.com
Mer 27 Nov 14:01:58 UTC 2019


@marc
>> Comment repérer les valeurs et/ou les clés erronées ?
> 
> cela dépend de ce que tu veux en faire.
> pour une édition de masse, le mieux est probablement de télécharger un
> extrait France, de filtrer pour ne garder que les objets avec une clef
> wikipedia et de tavailler dessus
Il n’y a pas forcément de grande quantité (quoi que avec toutes les sous clés)…
Mais un peu partout sur le globe… C’est très lourd à téléverser sur le serveur pays par pays.

Le plus simple serait d’avoir la bonne requête overpass et les corrections faites dans JOSM ou ses greffons.
Pour la requête, tout n’est pas faisable (cf. #146 <https://github.com/drolbr/Overpass-API/issues/146> faite il y a 5 ans déjà).
Pour rechercher les clés de la même façon avec taginfo, même problème (cf. #271 <https://github.com/taginfo/taginfo/issues/271>)

> pour améliorer la qualité des futures données, il est utile de faire les tickets/PR dans les éditeurs et osmose
Vous pouvez étayer les tickets existants 😎
Pour osmose, je sais qu’il fait des contrôle et des corrections. Pouvez-vous regarder de plus près ?

>> Faut-il les nettoyer ?
> 
> si cela te motive de proposer, n'hésites pas
Il y a des requêtes dans ma réponse à Jean-Yvon. L’intérêt de le faire à la main est de comprendre comment un contributeur arrive à faire ça.
Ça permettra de proposer des tickets et des correctifs plus adaptés et efficaces.

>> Si oui, comment ?
>>  * contrôles et corrections automatiques dans l’éditeur
> 
> à mon avis les 3
> - un contrôle à la source est toujours mieux que de corriger après.
Oui et comme le précise Jean-Yvon, ça évitera que ça se reproduise.

> pour éviter l'indigestion, je pense que tu devrais cibler
> un cas à la fois : par exemple les valeurs génériques
> ou les typo qu'il est possible parfois de corriger
> automatiquement à partir du wikidata
> ou n'importe quel autre cas qui te branche pour commencer :)
J’ai essayé de ne montrer que quelques exemples pour monter l’ampleur du bazar. Il y en a probablement pleins d’autres.
Je les ai mis en post-scriptum, j’aurais du rajouter un TL/DR 😁


J’ai aussi fait un tableau « synthétique » des contrôle des les éditeurs (mais le mél ne passe pas).

>> wikipedia=fr:Phare
> 
> introuvable même en utilisant overpass pour remonter au 1er janvier
> tu as un exemple ?
c’était un exemple avec un mot au pif.
ici, modification faite volontairement avec iD : https://www.openstreetmap.org/node/331257382/history

Il y en avait 260 le 15 novembre : https://overpass-turbo.eu/s/OvN

> a noter un cas fréquent en France : la mise du tag sur tous les rails d'une relation train
> 
Je suis tombé sur celle-là : https://www.openstreetmap.org/relation/6051577
rien sur la relation, tout sur les chemins : donc à nettoyer

Mais ça ne se cantonne pas à la France : https://taginfo.openstreetmap.org/keys/wikipedia?filter=ways#values
Si tu regardes les valeurs qui ont 3 ou plus de chemins, ça fait 10000 clés wikipedia !!!!!
La ligne Shinkansen Tōkaidō <https://www.openstreetmap.org/relation/5263977> fait 514 km. Elle a 2239 membres sous OSM !!
Tous? les segments semblent avoir tous les tags dupliqués : https://www.openstreetmap.org/way/609446768

> heu... ben du coup on discute de quoi ?
De comment éviter que ça revienne.
Nettoyer c’est bien, mais le faire façon tonneau des Danaïdes <https://fr.wikipedia.org/wiki/Dana%C3%AFdes#Mythe>, c’est un vrai châtiment. 😀

> je pensais que tu voulais discuter s'il fallait ou pas
> faire des opérations de masse
Aussi, car il y a tous? les pays, et tous les sous tags wikipedias 😀

>>  * subject:wikipedia:en
> 
> qu'est-ce qui n'est pas juste ?
C’est peut-être redondant avec subject:wikipedia=ru:*. subject:wikidata=Qxxx est peut-être largement suffisant et produit moins de maintenance.
Aucun des outils suivant n’affiche de lien (OpenStreetMap, overpass-turbo, iD, JOSM)
Quand a subject:wikidata, il ne manque que pour iD.

> 
>> Tags d'éléments « supprimés » Faut-il les supprimer ?
> cela n'a pas grand intérêt
De les garder, c’est bien ça ?

—
Yves
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20191127/06c895ad/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr