[talk-cz] Import/Synchronizace dat z All The Places
Vojtěch Fošnár
me na vfosnar.cz
Pátek Březen 15 11:50:30 UTC 2024
Nad licencí jsem dumal a už se to probíralo i na Matrix chatu.
> ATP.xyz sice ta data poskytuje jakoby CC-0 (na hlavní stránce), ale
> staví se k tomu mimořádně alibisticky "se mrkněte, jestli ten
> konkrétní zdroj fakt je ok, my to jen někde sehnali, cc0 je ta část,
> co k ní máme práva, mrk mrk":
> https://github.com/alltheplaces/alltheplaces/issues/5133
>
> Nezdá se mi, že takhle to funguje. Do OSM bych to rozhodně
> neimportoval - o nic víc, než jakýkoliv jiný data nascrapovaný z webu.
> "Nascrapoval to někdo jinej, já se tam radši nekoukal" z toho CC0 neudělá.
Toho jsem si vědom, ATP scrapery jsem ale všechny ručně procházel, ve
většině případů i poupravoval. Momentální scrapery používají veřejně
dostupné informace z webu a jejich dostupnost na mapách je v zájmu
daných společností. Něco jiného by bylo, kdyby se jednolo třeba o
scrapování firmy.cz.
> (Namátkou jsem se proklikal ke zdroji Decathlonu, a zrovna to je
> nějaká proprietární databáze, která rozhodně svobodná data neposkytuje)
Scraperu Decathlonu bych se např. vyhnul, protože má hardcoded API klíč.
Pokud ten API klíč ale posílá stránka a scraper ho extrahuje za běhu,
nevidím v tom problém.
On 15. 03. 24 12:32, Jan Martinec wrote:
> Ahoj, nepotěším tě,
>
> mám ZÁSADNÍ problém s licencí těch dat.
>
> ATP.xyz sice ta data poskytuje jakoby CC-0 (na hlavní stránce), ale
> staví se k tomu mimořádně alibisticky "se mrkněte, jestli ten
> konkrétní zdroj fakt je ok, my to jen někde sehnali, cc0 je ta část,
> co k ní máme práva, mrk mrk":
> https://github.com/alltheplaces/alltheplaces/issues/5133
>
> Nezdá se mi, že takhle to funguje. Do OSM bych to rozhodně
> neimportoval - o nic víc, než jakýkoliv jiný data nascrapovaný z webu.
> "Nascrapoval to někdo jinej, já se tam radši nekoukal" z toho CC0 neudělá.
>
> (Namátkou jsem se proklikal ke zdroji Decathlonu, a zrovna to je
> nějaká proprietární databáze, která rozhodně svobodná data neposkytuje)
>
> Zdar,
> Honza Piškvor Martinec
>
> Dne pá 15. 3. 2024 12:13 uživatel Vojtěch Fošnár <me na vfosnar.cz> napsal:
>
> Ahoj,
>
>
> Začal jsem pracovat na programu, co automaticky synchronizuje data z
> https://www.alltheplaces.xyz/ do OSM. Pokud má někdo zájem vypomoct,
> ocenil bych hlavně pomoc s kontrolou kvality, návrhy na další zdroje
> dat, popř. přispívat kód přímo do upstreamu All The Places. Kód bota
> jako takového mám v plánu dost měnit, takže tam spíš nic
> nepřidávat. Až
> dostanu dost feedbacku, chci spustit import přímo do OSM a exportovat
> pravidelně CSV s custom questama do SCEE (a možná
> https://github.com/Helium314/SCEE/issues/522).
>
>
> Přehled: https://atpsync.vfosnar.cz/
>
> SCEE custom quest CSV preview: https://atpsync.vfosnar.cz/scee.csv
> (Nastavení -> Data management -> Load custom quest file -> Provide)
>
> Zdroj bota: https://gitlab.com/vfosnar/atpsync
>
>
> Momentálně umí stahovat včetně otevírací doby:
>
> - Billa
>
> - Burger King
>
> - dm
>
> - KFC
>
> - Lidl
>
> - Mc Donald's
>
> - Teta
>
> A bez otevírací doby COOP.
>
>
> Nápady do budoucna:
>
> - Foodora - existence a otevírací doba všech podniků, ve kterých
> operuje?
>
> - Zásilkovna - to samé jako u Foodory
>
>
> _______________________________________________
> talk-cz mailing list
> talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
> https://openstreetmap.cz/talkcz
>
>
> _______________________________________________
> talk-cz mailing list
> talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
> https://openstreetmap.cz/talkcz
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <http://lists.openstreetmap.org/pipermail/talk-cz/attachments/20240315/5cddf28b/attachment.htm>
Další informace o konferenci talk-cz