[osm-hu] Tesco Import mehet?
Ferenc Veres
lion at netngine.hu
2018. Júl. 20., P, 10:06:44 UTC
Sziasztok!
Igen, a vízre eső 2%-ot csak példaként írtam. Ez az ötlet gondolom a
route4u import ezen hibájából született. De ez semmit sem változtat
azon, hogy a vízre esés nem rosszabb eset mint a temetőbe, kereszteződés
közepére vagy bármilyen más hibás helyre, tehát kicsi a jelentősége
külön vízbe esésre keresgélni. Esetleg egy iránymutatást ad az adatok
milyenségéről. (Ami szerencsére pozitív lett!)
A source=website vajon melyik website-ot jelenti. Pl lehet a brand helyi
vagy globális oldala, vagy akármi... De az igaz, hogy ha ott van a
website mint contact adat, akkor PONT AZT, szóval jó lesz ilyen
általános formában is.
Amiket én rajzoltam fel boltokat, nekem nem fog jól esni, ha mostantól
source=website-ok lesznek. Szerintem adatkiegészítés esetén a source a
changeset-re való. Azoknál jó a source=website, ahol az objetum maga az
OSM-be a website-ról kerül fel.
De kíváncsi lennék mások véleményére is, hátha csak én vagyok ilyen önző. :)
Manuális átnézés alatt nem ezt értettem amit most csinálunk, hogy
szúrópróba szerűen néha megnézünk valamit és próbálunk ezzel az
algoritmusokon finomítani, hanem mint a CLC vagy a BKK import, hogy
gyakorlatilag kézzel visszük fel az adatokat, minden egyes pontot
értelmezve. (Ez a vízre esést meg sok egyéb hibát is kiszűri.) Pl ezt az
1700 TESCO-t szétosztanánk 5-6 emberre, ahány jelentkező van, és annyi
OSM fájlt generálnál "validate=yes" tegekkel, ami az átnézés és a
valdiate törölgetése után feltölthető. Lehetnének akár 50db-os fájlok
is, és akkor 2-3 nap alatt dolgoznánk fel, fel lehet "félkészen" is
tölteni. A CLC import program pl a webes letöltés pillanatában mergelte
a live OSM adatokba az importálandó adatot és úgy köpött ki egy OSM
fájlt, amit szerkeszteni majd feltölteni kellett.
De ha ez meg túlzás, akkor nem kell. Örülök, ha nem kell. :)
Nominatimből nem tudsz cím alapján visszafejteni, mert nincs elég
házszám adat. Ugyanígy kézzel se tudom cím alapján felvinni, mert nem
tudom hova esik az adott utca adott száma. Vagy felhasználjuk a
vékony-jég koordinátát, vagy nem lehet felvinni az OSM-ben még nem
szereplő boltokat. Persze a bolt azt mondta, hogy használhatjuk, tehát
használhatjuk. Ők csak tudják, kirakták a saját weblapjukra is!
K&H adatok: gratulálok! :)
ERSTE-t azóta se piszkáltam tovább, habár igazad van, hogy ez a
'jelenleg nincs erőforrásunk "felfogni ezt a kérdést"'*... válaszuk azt
is jelentheti, hogy az azóta lehet, hogy lenne.
* nem ezt írták, de kb ezt jelentette.
Üdv,
Feri
2018.07.20. 8:44 keltezéssel, KAMI911 KAMI911 írta:
> Szia Feri,
>
> Teljesen igazad van, de a helyzet nem ilyen rossz :) Egyrészt egy POI
> esik vízre a 7100-ból és az is helyes hogy ott van, mert erről van szó:
> https://index.hu/belfold/budapest/2014/04/02/atadtak_a_zold_szigetet_a_dunan/
>
> A TESCO-s adatok vannak valóban pontatlanságok, de mivel a legtöbb Tesco
> fel van szerkesztve, meg a S-Market boltok is, így azt gondolom nagy
> hibát nem követünk el. Csak sok adattal kiegészítjük a meglévő POI-kat.
> A többi adatforrás kérdéses persze, de mindegyiknél az OSM fájlban vagy
> egy distance megjegyzés, amiben látható a POi és a OSM objektum
> távolsága méterben.
>
> Ha egyetértetek, hogy a source honlap URL jobb lenne, akkor meg lehet
> azt is csinálni. Gondoltam, ha mát ott van a website tag minden PI-n
> akkor felesleges, de ha támogatjátok akkor úgy lesz.
>
> Ha egy meglévő OSM objektum egészül ki akkor is az adatok nagy része a
> website-ról jön, a source ezért is íródik át és ezért kap date
> kiegészítést. Az OSM fájlban látszik, hogy mik voltak az eredeti POI
> adatok. A távolsággal együtt "szinte" térkép nélkül is eldönthető, hogy
> a megfelelő POI kerül kiegészítésre.
>
> A manuális átnézés erősen támogatott :) Én már nagyon sokszor néztem át
> a kimenetet. De mivel a githubon minden osm kimenet fent van, bárki
> megteheti ezt, akit érdekel a téma. Én örülök, hogy még több szempár
> megnézné, akár elosztva akár többszörösen.
>
> Igazad van a jég különböző vékonyságú. A geokódolóból kijövő adat
> tényleg lehet akár Google is. Ezt azzal próbáljuk kivédeni, hogy amit
> lehet azt OSM objektumra illesztünk. Innentől kezdve a geokódoó kimenet
> csak az OSM objektum megtalálásához mankó. Persze, ahol nincs találat
> ott felhasználásra kerül az adat. De ezt még lehetne hátrább sorolni, ha
> előbb az OSM Nominatimon futtatjuk végig a keresést. Nem tudom ez
> mennyire helyes eljárás, vagy mennyiben lehet jó. Végső esetben az is
> lehet, hogy az OSM-en beazonosítható objektumokat importáljuk. A
> többieket a cím alapján manuálisan feljelöljük a térképre, a megfelelő
> paraméterekkel, amelyet majd az importáló megtalál és kiegészít. De
> ehhez kellene legalább 5-10 ember, aki a térképen feljelöli a több mint
> 3000 új POI-t.
>
> Közben érkezett engedély a K&H-tól is. :) A részben konvertált adatok
> (nyitvatartás még nincs) már a szokásos helyen git-ben.
>
> Üdvözlettel / Best Regards:
>
> Kálmán (KAMI) Szalai
>
> 2018. július 19. 12:36 Ferenc Veres írta, <lion at netngine.hu
> <mailto:lion at netngine.hu>>:
>
> Szerintem ha van egy adatforrás, amiben mondjuk a POI-k 2%-a vízre
> esik, akkor ezen 2% kiszűrésével szinte semmit sem javítanánk a
> helyzeten. Érted, így a megmaradt 98% POI legalább 1,98%-a még
> mindig legalább olyan pontatlan (csak nem vízre esik), csak
> megszüntettük a pontatlanságra utaló evidens figyelmeztető jeleinket.
>
> Sőt, az 1,98% felszorozható az ország területén található
> szárazföld:víz arányával. Ez struccpolitika lenne. Semmivel se jobb
> egy a falu mellett a semmiben lévő bolt mint a Balatonban.
>
> De arra jó volt a teszted, hogy a POI forrás általános
> megbízhatóságát felmérje, és ebben le a kalappal az eredményhez!
>
> Pontosabb lenne source=tesco.hu <http://tesco.hu> mint source=website.
>
> Viszont mi van, ha egy meglévő OSM objektum egészül ki pl
> nyitvatartással, stb, akkor szerintem az objektumon nem szabad
> source= taget felülírni. Akkor a changeset source=-ből derülhet ki,
> honnan jött a plusz adat? (Részemről ezt támogatom, nem szeretem a
> címkénkénti source teget, kivéve a maxspeed.)
>
> Manuális átnézés teljesen esélytelen és nem is tervezett? (Akár
> manuális import, szétosztva pár emberre a fájlt.)
>
> A weblapokon látható koordináták egybénént származhatnak cím
> geokódinból is pl Google API-ról, ez nem vékony jég egy kicsit?
> (Akárki is írta alá, hogy felhasználható a lista.)
>
> Üdv,
> Feri
>
>
>
> 2018.07.18. 21:56 keltezéssel, KAMI911 KAMI911 írta:
>
> Sziasztok,
>
> Csináltam a vízre való importálás kiküszöbölésére egy
> ellenőrzőt, ami a kimeneti OSM fájlban is megjelenik
> megjegyzésként. A 7172 POI-ból egyetlen egy van vízen, a MOL
> zöld szigete. MOL Magyarország 1111
>
>
> --
> Magyar OSM Levelezőlista - openstreetmap-hungary at googlegroups.com
> <mailto:openstreetmap-hungary at googlegroups.com>
> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com
> <mailto:openstreetmap-hungary%2Bunsubscribe at googlegroups.com>
> --- Azért kapta ezt az üzenetet, mert feliratkozott a Google
> Csoportok szolgáltatásbeli openstreetmap-hungary csoportra.
> Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való
> leiratkozáshoz küldjön egy e-amailt a(z)
> openstreetmap-hungary+unsubscribe at googlegroups.com
> <mailto:openstreetmap-hungary%2Bunsubscribe at googlegroups.com> címre.
> További lehetőségekért látogasson el a(z)
> https://groups.google.com/d/optout
> <https://groups.google.com/d/optout> címre.
>
>
> --
> Magyar OSM Levelezőlista - openstreetmap-hungary at googlegroups.com
> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com
> ---
> Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok
> „openstreetmap-hungary” csoportjára.
> Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való
> leiratkozáshoz küldjön egy e-amailt a(z)
> openstreetmap-hungary+unsubscribe at googlegroups.com
> <mailto:openstreetmap-hungary+unsubscribe at googlegroups.com> címre.
> További lehetőségekért látogasson el ide:
> https://groups.google.com/d/optout.
További információk a(z) Talk-hu levelezőlistáról