[OSM-talk-fr] wikidata vs brand:wikidata

PanierAvide panieravide at riseup.net
Ven 13 Avr 10:26:56 UTC 2018


Bonjour,

À priori ce serait pas mal de commencer à nettoyer les données, pour 
éviter l'effet de recopie basée sur ce que fait le voisin. Avec le 
service Wikidata + OSM, on peut les repérer assez rapidement, exemple 
avec les magasins de chaînes 
<https://sophox.org/sophox/#%23Objects%20linking%20to%20place%20of%20business%20with%20%22wikidata%22%20tag%20instead%20of%20%22operator%3Awikidata%22%20tag%0ASELECT%20%3FosmId%20%3FwdLabel%20%3Fwd%20%3FwpTag%20WHERE%20%7B%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20an%20OSM%20type%20%28%27n%27%2C%20%27r%27%2C%20%27w%27%29.%0A%20%20%23%20Replace%20%3FosmType%20with%20a%20string%20%27r%27%20to%20show%20only%20relations.%0A%20%20%3FosmId%20osmm%3Atype%20%3FosmType%20.%0A%0A%20%20%23%20Limit%20to%20subjects%20that%20have%20a%20tag%20called%20%22wikidata%22%0A%20%20%3FosmId%20osmt%3Awikidata%20%3Fwd%20.%0A%0A%20%20%23%20Filter%20out%20entries%20that%20have%20identical%20wikidata%20and%20operator%3Awikidata%0A%20%20%23%20In%20theory%20there%20should%20only%20be%20one%20WP%20tag%0A%20%20FILTER%20NOT%20EXISTS%20%7B%20%3FosmId%20osmt%3Abrand%3Awikidata%20%3Fwd%20.%20%7D%0A%0A%20%20%23%20Include%20Wikipedia%20tag%20if%20it%20exists%0A%20%20OPTIONAL%20%7B%20%3FosmId%20osmt%3Awikipedia%20%3FwpTag%20.%20%7D%0A%0A%20%20%23%20Optionally%2C%20find%20pl%3A%2a%20wikipedia%20tags%20%28point%20to%20Polish%20wiki%29%0A%20%20%23%20For%20performance%2C%20remove%20the%20%22OPTIONAL%20%7B%22%20and%20%22%7D%22%20part%20above%0A%20%20%23%20FILTER%28%20STRSTARTS%28STR%28%3FwpTag%29%2C%20%27https%3A%2F%2Fpl.wikipedia%27%29%29%20.%0A%0A%20%20%23%20Or%2C%20instead%2C%20only%20show%20Wikidata%20items%20that%20have%20a%20Polish%20WP%20article%0A%20%20%23%20You%20may%20also%20want%20to%20add%20%3Farticle%20to%20the%20list%20of%20fields%20returns%20by%20SELECT%20statement%0A%20%20%23%20%20%3Farticle%20schema%3Aabout%20%3Fwd%20.%0A%20%20%23%20%20%3Farticle%20schema%3AisPartOf%20%3Chttps%3A%2F%2Fpl.wikipedia.org%2F%3E.%0A%0A%20%20%23%20Optionally%2C%20restrict%20OSM%20objects%20to%20those%20that%20have%20a%20specific%20tag%20%28and%20value%29%0A%20%20%23%20%20%3FosmId%20osmt%3Aplace%20%27city%27%20.%20%20%20%20%20%20%20%20%23%20exact%20string%20matching%0A%20%20%23%20%20%3FosmId%20osmt%3Aname%3Aen%20%3Fnameen%20.%20%20%20%20%20%23%20unless%20filtered%2C%20matches%20all%20objects%20with%20this%20tag%0A%20%20%23%20%20FILTER%28%20regex%28%3Fnameen%2C%20%22A.b%22%29%20%29%20%20%20%20%23%20filter%20name%3Aen%20to%20match%20a%20regex.%20Not%20very%20efficient%0A%0A%20%20%23%20%3Fwd%20must%20be%20%22instance%20of%22%20an%20enterprise%2C%20or%20instance%20of%20an%20item%20which%20is%20a%20subclass%28es%29%20of%20it.%0A%20%20%3Fwd%20wdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ507619%20.%0A%0A%20%20%23%20Pick%20the%20first%20available%20language%20for%20the%20wikidata%20entry%20%28creates%20%3FwdLabel%20value%29%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%2Cde%2Cfr%2Cit%2Cpl%2Cru%2Ces%2Csv%2Cnl%22%20.%20%7D%0A%7D%0ALIMIT%2050> 
(il manque que de filtrer par pays, mais ça dépasse mes compétences en 
SPARQL). Si on a la bonne requête SPARQL, on peut se partager la tâche 
par département, et assez rapidement s'en sortir. Le tout c'est de 
savoir si on commence par les réseaux de transports, les magasins, les 
équipements... Le plus simple est sûrement les magasins, car ils ont 
l'air renseignés de manière homogène côté Wikidata, ce qui n'est pas le 
cas des réseaux de transports.

Une fois que le nettoyage est fait, une bonne analyse Osmose permettra 
justement d'identifier les nouvelles erreurs. Il faudra par contre voir 
si c'est possible de créer une analyse basée sur une sortie de wikidata 
(à priori non ?).

De mon côté je suis partant pour donner un coup de main sur le sujet 
(j'avais soulevé la question sur talk-fr-bzh en juillet dernier [1]).

Adrien.

[1] 
https://lists.openstreetmap.org/pipermail/talk-fr-bzh/2017-July/002049.html



Le 13/04/2018 à 11:20, Noémie Lehuby a écrit :
>
> Hello,
>
> Merci. J'ai corrigé les Autolib', mais le problème est plus vaste : on 
> a le même souci avec les Franprix ou les Décathlon par exemple.
>
> Y a des gens motivés pour m'aider à corriger tout ça et/ou bosser sur 
> une analyse Osmose sur le sujet ?
>
> Noémie
>
> Le 2018-04-11 18:58, PanierAvide a écrit :
>
>> Bonjour,
>>
>> C'est bien ça, le wikidata=* doit pointer sur l'item correspondant à 
>> cet objet précis, donc là préférer brand:wikidata=* ou 
>> operator:wikidata=* (ou network:wikidata si Autolib' désigne le nom 
>> du réseau parisien).
>>
>> Adrien.
>>
>>
>> Le 11/04/2018 à 16:13, Noémie Lehuby a écrit :
>>>
>>> Bonjour,
>>>
>>> Le tag wikidata correspondant à Autolib' a été ajouté sur les 
>>> stations Autolib' de région parisienne.
>>> Par exemple : https://www.openstreetmap.org/node/4472979080
>>>
>>> Il me semble que cela devrait être dans un tag brand:wikidata (voire 
>>> operator:wikidata). Je me trompe ?
>>>
>>> Noémie
>>>
>>>
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr at openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>> -- 
>> PanierAvide
>> Géomaticien & développeur
>>
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
>> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr


-- 
PanierAvide
Géomaticien & développeur

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20180413/445515b0/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr