[OSM-talk-fr] wikidata vs brand:wikidata

PanierAvide panieravide at riseup.net
Ven 13 Avr 16:49:03 UTC 2018


Pour sortir les lieux depuis Overpass à l'aide des ID wikidata, une 
méthode de truand :

- Reprendre la requête sur Paris, élargir le champ de rehcherche, et 
changer la ligne du select en :
SELECT distinct ?wd WHERE {

- Sortir la liste des tags wikidata en export CSV
- Abattre quelques expressions régulières pour que ça ressemble à de 
l'Overpass (ajout de l'en-tête, fin de requête, et transformer chaque 
ligne d'identifiant en une sélection wikidata=la valeur)

Ça donne ça pour les valeurs les plus courantes sorties de Wikidata :
http://overpass-turbo.eu/s/xRn

Soit plus de 200 lieux sur une emprise métropolitaine. On part sur une 
tâche Maproulette ?

Adrien.


Le 13/04/2018 à 15:31, Noémie Lehuby a écrit :
>
> Hello,
>
> Les deux approches me semblent pertinentes :
> celles basée sur les occurrences sera surement plus facile à ajouter à 
> Osmose
> celle basée sur wikidata fait plus de sens pour partager le travail de 
> nettoyage. Et les magasins sont un bon objectif pour commencer
>
> Voilà une requête limitée aux alentours de Paris : 
> http://tinyurl.com/y8wf63u5
> je ne sais pas s'il est possible d'aller plus loin dans le découpage 
> géographique avec cet outil
>
> Une autre approche serait d'utiliser wikidata uniquement pour 
> récupérer les id qui devraient être dans un tag brand:wikidata au lieu 
> de wikidata, puis passer directement à overpass pour les rechercher ...
>
> Noémie
>
> Le 2018-04-13 12:26, PanierAvide a écrit :
>
>> Bonjour,
>>
>> À priori ce serait pas mal de commencer à nettoyer les données, pour 
>> éviter l'effet de recopie basée sur ce que fait le voisin. Avec le 
>> service Wikidata + OSM, on peut les repérer assez rapidement, exemple 
>> avec les magasins de chaînes 
>> <https://sophox.org/sophox/#%23Objects%20linking%20to%20place%20of%20business%20with%20%22wikidata%22%20tag%20instead%20of%20%22operator%3Awikidata%22%20tag%0ASELECT%20%3FosmId%20%3FwdLabel%20%3Fwd%20%3FwpTag%20WHERE%20%7B%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20an%20OSM%20type%20%28%27n%27%2C%20%27r%27%2C%20%27w%27%29.%0A%20%20%23%20Replace%20%3FosmType%20with%20a%20string%20%27r%27%20to%20show%20only%20relations.%0A%20%20%3FosmId%20osmm%3Atype%20%3FosmType%20.%0A%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20a%20tag%20called%20%22wikidata%22%0A%20%20%3FosmId%20osmt%3Awikidata%20%3Fwd%20.%0A%0A%20%20%23%20Filter%20out%20entries%20that%20have%20identical%20wikidata%20and%20operator%3Awikidata%0A%20%20%23%20In%20theory%20there%20should%20only%20be%20one%20WP%20tag%0A%20%20FILTER%20NOT%20EXISTS%20%7B%20%3FosmId%20osmt%3Abrand%3Awikidata%20%3Fwd%20.%20%7D%0A%0A%20%20%23%20Include%20Wikipedia%20tag%20if%20it%20exists%0A%20%20OPTIONAL%20%7B%20%3FosmId%20osmt%3Awikipedia%20%3FwpTag%20.%20%7D%0A%0A%20%20%23%20Optionally%2C%20find%20pl%3A%2a%20wikipedia%20tags%20%28point%20to%20Polish%20wiki%29%0A%20%20%23%20For%20performance%2C%20remove%20the%20%22OPTIONAL%20%7B%22%20and%20%22%7D%22%20part%20above%0A%20%20%23%20FILTER%28%20STRSTARTS%28STR%28%3FwpTag%29%2C%20%27https%3A%2F%2Fpl.wikipedia%27%29%29%20.%0A%0A%20%20%23%20Or%2C%20instead%2C%20only%20show%20Wikidata%20items%20that%20have%20a%20Polish%20WP%20article%0A%20%20%23%20You%20may%20also%20want%20to%20add%20%3Farticle%20to%20the%20list%20of%20fields%20returns%20by%20SELECT%20statement%0A%20%20%23%20%20%3Farticle%20schema%3Aabout%20%3Fwd%20.%0A%20%20%23%20%20%3Farticle%20schema%3AisPartOf%20%3Chttps%3A%2F%2Fpl.wikipedia.org%2F%3E.%0A%0A%20%20%23%20Optionally%2C%20restrict%20OSM%20objects%20to%20those%20that%20have%20a%20specific%20tag%20%28and%20value%29%0A%20%20%23%20%20%3FosmId%20osmt%3Aplace%20%27city%27%20.%20%20%20%20%20%20%20%20%23%20exact%20string%20matching%0A%20%20%23%20%20%3FosmId%20osmt%3Aname%3Aen%20%3Fnameen%20.%20%20%20%20%20%23%20unless%20filtered%2C%20matches%20all%20objects%20with%20this%20tag%0A%20%20%23%20%20FILTER%28%20regex%28%3Fnameen%2C%20%22A.b%22%29%20%29%20%20%20%20%23%20filter%20name%3Aen%20to%20match%20a%20regex.%20Not%20very%20efficient%0A%0A%20%20%23%20%3Fwd%20must%20be%20%22instance%20of%22%20an%20enterprise%2C%20or%20instance%20of%20an%20item%20which%20is%20a%20subclass%28es%29%20of%20it.%0A%20%20%3Fwd%20wdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ507619%20.%0A%0A%20%20%23%20Pick%20the%20first%20available%20language%20for%20the%20wikidata%20entry%20%28creates%20%3FwdLabel%20value%29%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%2Cde%2Cfr%2Cit%2Cpl%2Cru%2Ces%2Csv%2Cnl%22%20.%20%7D%0A%7D%0ALIMIT%2050> 
>> (il manque que de filtrer par pays, mais ça dépasse mes compétences 
>> en SPARQL). Si on a la bonne requête SPARQL, on peut se partager la 
>> tâche par département, et assez rapidement s'en sortir. Le tout c'est 
>> de savoir si on commence par les réseaux de transports, les magasins, 
>> les équipements... Le plus simple est sûrement les magasins, car ils 
>> ont l'air renseignés de manière homogène côté Wikidata, ce qui n'est 
>> pas le cas des réseaux de transports.
>>
>> Une fois que le nettoyage est fait, une bonne analyse Osmose 
>> permettra justement d'identifier les nouvelles erreurs. Il faudra par 
>> contre voir si c'est possible de créer une analyse basée sur une 
>> sortie de wikidata (à priori non ?).
>>
>> De mon côté je suis partant pour donner un coup de main sur le sujet 
>> (j'avais soulevé la question sur talk-fr-bzh en juillet dernier [1]).
>>
>> Adrien.
>>
>> [1] 
>> https://lists.openstreetmap.org/pipermail/talk-fr-bzh/2017-July/002049.html
>>
>>
>>
>> Le 13/04/2018 à 11:20, Noémie Lehuby a écrit :
>>>
>>> Hello,
>>>
>>> Merci. J'ai corrigé les Autolib', mais le problème est plus vaste : 
>>> on a le même souci avec les Franprix ou les Décathlon par exemple.
>>>
>>> Y a des gens motivés pour m'aider à corriger tout ça et/ou bosser 
>>> sur une analyse Osmose sur le sujet ?
>>>
>>> Noémie
>>>
>>> Le 2018-04-11 18:58, PanierAvide a écrit :
>>>
>>>     Bonjour,
>>>
>>>     C'est bien ça, le wikidata=* doit pointer sur l'item
>>>     correspondant à cet objet précis, donc là préférer
>>>     brand:wikidata=* ou operator:wikidata=* (ou network:wikidata si
>>>     Autolib' désigne le nom du réseau parisien).
>>>
>>>     Adrien.
>>>
>>>
>>>     Le 11/04/2018 à 16:13, Noémie Lehuby a écrit :
>>>
>>>         Bonjour,
>>>
>>>         Le tag wikidata correspondant à Autolib' a été ajouté sur
>>>         les stations Autolib' de région parisienne.
>>>         Par exemple : https://www.openstreetmap.org/node/4472979080
>>>
>>>         Il me semble que cela devrait être dans un tag
>>>         brand:wikidata (voire operator:wikidata). Je me trompe ?
>>>
>>>         Noémie
>>>
>>>
>>>
>>>         _______________________________________________
>>>         Talk-fr mailing list
>>>         Talk-fr at openstreetmap.org
>>>         https://lists.openstreetmap.org/listinfo/talk-fr
>>>
>>>     -- 
>>>     PanierAvide
>>>     Géomaticien & développeur
>>>
>>>
>>>     _______________________________________________
>>>     Talk-fr mailing list
>>>     Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
>>>     https://lists.openstreetmap.org/listinfo/talk-fr
>>>
>>>
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr at openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>> -- 
>> PanierAvide
>> Géomaticien & développeur
>>
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
>> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr


-- 
PanierAvide
Géomaticien & développeur

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20180413/44c1e6d1/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr