[OSM-talk-fr] wikidata vs brand:wikidata
PanierAvide
panieravide at riseup.net
Ven 13 Avr 16:49:03 UTC 2018
Pour sortir les lieux depuis Overpass à l'aide des ID wikidata, une
méthode de truand :
- Reprendre la requête sur Paris, élargir le champ de rehcherche, et
changer la ligne du select en :
SELECT distinct ?wd WHERE {
- Sortir la liste des tags wikidata en export CSV
- Abattre quelques expressions régulières pour que ça ressemble à de
l'Overpass (ajout de l'en-tête, fin de requête, et transformer chaque
ligne d'identifiant en une sélection wikidata=la valeur)
Ça donne ça pour les valeurs les plus courantes sorties de Wikidata :
http://overpass-turbo.eu/s/xRn
Soit plus de 200 lieux sur une emprise métropolitaine. On part sur une
tâche Maproulette ?
Adrien.
Le 13/04/2018 à 15:31, Noémie Lehuby a écrit :
>
> Hello,
>
> Les deux approches me semblent pertinentes :
> celles basée sur les occurrences sera surement plus facile à ajouter à
> Osmose
> celle basée sur wikidata fait plus de sens pour partager le travail de
> nettoyage. Et les magasins sont un bon objectif pour commencer
>
> Voilà une requête limitée aux alentours de Paris :
> http://tinyurl.com/y8wf63u5
> je ne sais pas s'il est possible d'aller plus loin dans le découpage
> géographique avec cet outil
>
> Une autre approche serait d'utiliser wikidata uniquement pour
> récupérer les id qui devraient être dans un tag brand:wikidata au lieu
> de wikidata, puis passer directement à overpass pour les rechercher ...
>
> Noémie
>
> Le 2018-04-13 12:26, PanierAvide a écrit :
>
>> Bonjour,
>>
>> À priori ce serait pas mal de commencer à nettoyer les données, pour
>> éviter l'effet de recopie basée sur ce que fait le voisin. Avec le
>> service Wikidata + OSM, on peut les repérer assez rapidement, exemple
>> avec les magasins de chaînes
>> <https://sophox.org/sophox/#%23Objects%20linking%20to%20place%20of%20business%20with%20%22wikidata%22%20tag%20instead%20of%20%22operator%3Awikidata%22%20tag%0ASELECT%20%3FosmId%20%3FwdLabel%20%3Fwd%20%3FwpTag%20WHERE%20%7B%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20an%20OSM%20type%20%28%27n%27%2C%20%27r%27%2C%20%27w%27%29.%0A%20%20%23%20Replace%20%3FosmType%20with%20a%20string%20%27r%27%20to%20show%20only%20relations.%0A%20%20%3FosmId%20osmm%3Atype%20%3FosmType%20.%0A%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20a%20tag%20called%20%22wikidata%22%0A%20%20%3FosmId%20osmt%3Awikidata%20%3Fwd%20.%0A%0A%20%20%23%20Filter%20out%20entries%20that%20have%20identical%20wikidata%20and%20operator%3Awikidata%0A%20%20%23%20In%20theory%20there%20should%20only%20be%20one%20WP%20tag%0A%20%20FILTER%20NOT%20EXISTS%20%7B%20%3FosmId%20osmt%3Abrand%3Awikidata%20%3Fwd%20.%20%7D%0A%0A%20%20%23%20Include%20Wikipedia%20tag%20if%20it%20exists%0A%20%20OPTIONAL%20%7B%20%3FosmId%20osmt%3Awikipedia%20%3FwpTag%20.%20%7D%0A%0A%20%20%23%20Optionally%2C%20find%20pl%3A%2a%20wikipedia%20tags%20%28point%20to%20Polish%20wiki%29%0A%20%20%23%20For%20performance%2C%20remove%20the%20%22OPTIONAL%20%7B%22%20and%20%22%7D%22%20part%20above%0A%20%20%23%20FILTER%28%20STRSTARTS%28STR%28%3FwpTag%29%2C%20%27https%3A%2F%2Fpl.wikipedia%27%29%29%20.%0A%0A%20%20%23%20Or%2C%20instead%2C%20only%20show%20Wikidata%20items%20that%20have%20a%20Polish%20WP%20article%0A%20%20%23%20You%20may%20also%20want%20to%20add%20%3Farticle%20to%20the%20list%20of%20fields%20returns%20by%20SELECT%20statement%0A%20%20%23%20%20%3Farticle%20schema%3Aabout%20%3Fwd%20.%0A%20%20%23%20%20%3Farticle%20schema%3AisPartOf%20%3Chttps%3A%2F%2Fpl.wikipedia.org%2F%3E.%0A%0A%20%20%23%20Optionally%2C%20restrict%20OSM%20objects%20to%20those%20that%20have%20a%20specific%20tag%20%28and%20value%29%0A%20%20%23%20%20%3FosmId%20osmt%3Aplace%20%27city%27%20.%20%20%20%20%20%20%20%20%23%20exact%20string%20matching%0A%20%20%23%20%20%3FosmId%20osmt%3Aname%3Aen%20%3Fnameen%20.%20%20%20%20%20%23%20unless%20filtered%2C%20matches%20all%20objects%20with%20this%20tag%0A%20%20%23%20%20FILTER%28%20regex%28%3Fnameen%2C%20%22A.b%22%29%20%29%20%20%20%20%23%20filter%20name%3Aen%20to%20match%20a%20regex.%20Not%20very%20efficient%0A%0A%20%20%23%20%3Fwd%20must%20be%20%22instance%20of%22%20an%20enterprise%2C%20or%20instance%20of%20an%20item%20which%20is%20a%20subclass%28es%29%20of%20it.%0A%20%20%3Fwd%20wdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ507619%20.%0A%0A%20%20%23%20Pick%20the%20first%20available%20language%20for%20the%20wikidata%20entry%20%28creates%20%3FwdLabel%20value%29%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%2Cde%2Cfr%2Cit%2Cpl%2Cru%2Ces%2Csv%2Cnl%22%20.%20%7D%0A%7D%0ALIMIT%2050>
>> (il manque que de filtrer par pays, mais ça dépasse mes compétences
>> en SPARQL). Si on a la bonne requête SPARQL, on peut se partager la
>> tâche par département, et assez rapidement s'en sortir. Le tout c'est
>> de savoir si on commence par les réseaux de transports, les magasins,
>> les équipements... Le plus simple est sûrement les magasins, car ils
>> ont l'air renseignés de manière homogène côté Wikidata, ce qui n'est
>> pas le cas des réseaux de transports.
>>
>> Une fois que le nettoyage est fait, une bonne analyse Osmose
>> permettra justement d'identifier les nouvelles erreurs. Il faudra par
>> contre voir si c'est possible de créer une analyse basée sur une
>> sortie de wikidata (à priori non ?).
>>
>> De mon côté je suis partant pour donner un coup de main sur le sujet
>> (j'avais soulevé la question sur talk-fr-bzh en juillet dernier [1]).
>>
>> Adrien.
>>
>> [1]
>> https://lists.openstreetmap.org/pipermail/talk-fr-bzh/2017-July/002049.html
>>
>>
>>
>> Le 13/04/2018 à 11:20, Noémie Lehuby a écrit :
>>>
>>> Hello,
>>>
>>> Merci. J'ai corrigé les Autolib', mais le problème est plus vaste :
>>> on a le même souci avec les Franprix ou les Décathlon par exemple.
>>>
>>> Y a des gens motivés pour m'aider à corriger tout ça et/ou bosser
>>> sur une analyse Osmose sur le sujet ?
>>>
>>> Noémie
>>>
>>> Le 2018-04-11 18:58, PanierAvide a écrit :
>>>
>>> Bonjour,
>>>
>>> C'est bien ça, le wikidata=* doit pointer sur l'item
>>> correspondant à cet objet précis, donc là préférer
>>> brand:wikidata=* ou operator:wikidata=* (ou network:wikidata si
>>> Autolib' désigne le nom du réseau parisien).
>>>
>>> Adrien.
>>>
>>>
>>> Le 11/04/2018 à 16:13, Noémie Lehuby a écrit :
>>>
>>> Bonjour,
>>>
>>> Le tag wikidata correspondant à Autolib' a été ajouté sur
>>> les stations Autolib' de région parisienne.
>>> Par exemple : https://www.openstreetmap.org/node/4472979080
>>>
>>> Il me semble que cela devrait être dans un tag
>>> brand:wikidata (voire operator:wikidata). Je me trompe ?
>>>
>>> Noémie
>>>
>>>
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr at openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>>
>>> --
>>> PanierAvide
>>> Géomaticien & développeur
>>>
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>>
>>>
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr at openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>> --
>> PanierAvide
>> Géomaticien & développeur
>>
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
>> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
--
PanierAvide
Géomaticien & développeur
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20180413/44c1e6d1/attachment.htm>
Plus d'informations sur la liste de diffusion Talk-fr