[talk-cz] Import/Synchronizace dat z All The Places

Vojtěch Fošnár me na vfosnar.cz
Pátek Březen 15 11:50:30 UTC 2024


Nad licencí jsem dumal a už se to probíralo i na Matrix chatu.


> ATP.xyz sice ta data poskytuje jakoby CC-0 (na hlavní stránce), ale 
> staví se k tomu mimořádně alibisticky "se mrkněte, jestli ten 
> konkrétní zdroj fakt je ok, my to jen někde sehnali, cc0 je ta část, 
> co k ní máme práva, mrk mrk":
> https://github.com/alltheplaces/alltheplaces/issues/5133
>
> Nezdá se mi, že takhle to funguje. Do OSM bych to rozhodně 
> neimportoval - o nic víc, než jakýkoliv jiný data nascrapovaný z webu. 
> "Nascrapoval to někdo jinej, já se tam radši nekoukal" z toho CC0 neudělá.

Toho jsem si vědom, ATP scrapery jsem ale všechny ručně procházel, ve 
většině případů i poupravoval. Momentální scrapery používají veřejně 
dostupné informace z webu a jejich dostupnost na mapách je v zájmu 
daných společností. Něco jiného by bylo, kdyby se jednolo třeba o 
scrapování firmy.cz.


> (Namátkou jsem se proklikal ke zdroji Decathlonu, a zrovna to je 
> nějaká proprietární databáze, která rozhodně svobodná data neposkytuje)

Scraperu Decathlonu bych se např. vyhnul, protože má hardcoded API klíč. 
Pokud ten API klíč ale posílá stránka a scraper ho extrahuje za běhu, 
nevidím v tom problém.


On 15. 03. 24 12:32, Jan Martinec wrote:
> Ahoj, nepotěším tě,
>
> mám ZÁSADNÍ problém s licencí těch dat.
>
> ATP.xyz sice ta data poskytuje jakoby CC-0 (na hlavní stránce), ale 
> staví se k tomu mimořádně alibisticky "se mrkněte, jestli ten 
> konkrétní zdroj fakt je ok, my to jen někde sehnali, cc0 je ta část, 
> co k ní máme práva, mrk mrk":
> https://github.com/alltheplaces/alltheplaces/issues/5133
>
> Nezdá se mi, že takhle to funguje. Do OSM bych to rozhodně 
> neimportoval - o nic víc, než jakýkoliv jiný data nascrapovaný z webu. 
> "Nascrapoval to někdo jinej, já se tam radši nekoukal" z toho CC0 neudělá.
>
> (Namátkou jsem se proklikal ke zdroji Decathlonu, a zrovna to je 
> nějaká proprietární databáze, která rozhodně svobodná data neposkytuje)
>
> Zdar,
> Honza Piškvor Martinec
>
> Dne pá 15. 3. 2024 12:13 uživatel Vojtěch Fošnár <me na vfosnar.cz> napsal:
>
>     Ahoj,
>
>
>     Začal jsem pracovat na programu, co automaticky synchronizuje data z
>     https://www.alltheplaces.xyz/ do OSM. Pokud má někdo zájem vypomoct,
>     ocenil bych hlavně pomoc s kontrolou kvality, návrhy na další zdroje
>     dat, popř. přispívat kód přímo do upstreamu All The Places. Kód bota
>     jako takového mám v plánu dost měnit, takže tam spíš nic
>     nepřidávat. Až
>     dostanu dost feedbacku, chci spustit import přímo do OSM a exportovat
>     pravidelně CSV s custom questama do SCEE (a možná
>     https://github.com/Helium314/SCEE/issues/522).
>
>
>     Přehled: https://atpsync.vfosnar.cz/
>
>     SCEE custom quest CSV preview: https://atpsync.vfosnar.cz/scee.csv
>     (Nastavení -> Data management -> Load custom quest file -> Provide)
>
>     Zdroj bota: https://gitlab.com/vfosnar/atpsync
>
>
>     Momentálně umí stahovat včetně otevírací doby:
>
>     - Billa
>
>     - Burger King
>
>     - dm
>
>     - KFC
>
>     - Lidl
>
>     - Mc Donald's
>
>     - Teta
>
>     A bez otevírací doby COOP.
>
>
>     Nápady do budoucna:
>
>     - Foodora - existence a otevírací doba všech podniků, ve kterých
>     operuje?
>
>     - Zásilkovna - to samé jako u Foodory
>
>
>     _______________________________________________
>     talk-cz mailing list
>     talk-cz na openstreetmap.org
>     https://lists.openstreetmap.org/listinfo/talk-cz
>     https://openstreetmap.cz/talkcz
>
>
> _______________________________________________
> talk-cz mailing list
> talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
> https://openstreetmap.cz/talkcz
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <http://lists.openstreetmap.org/pipermail/talk-cz/attachments/20240315/5cddf28b/attachment.htm>


Další informace o konferenci talk-cz