Re: [osm-hu] Re: osm_id és POI-k összerendelése

bkil bkil.hu at gmail.com
2018. Feb. 14., Sze, 18:19:46 UTC


Helló!

A deduplikációs és jövőbeli karbantarthatóságra irányuló erőfeszítéseidet
üdvözlöm, és köszönjük, hogy megosztottad a fejlesztéseid jelenlegi állását.

A félreértések elkerülése végett mindenképpen beszéljük meg személyesen,
mert az apró részletekben lehet, hogy nem fog mindenki egyet érteni.

Minden jót, csak így tovább!

2018-02-14 9:49 GMT+01:00 KAMI911 KAMI911 <kami911 at gmail.com>:

> Szia,
>
> Mint azt írtam fentebb a hash-t nem akarom az OSM db-be tenni. Csak arra
> vonatkozott a kérdés, hogy lehet ez kellően unique. Gondoltam igen, de
> ahogy a fenti példák is mutatták nem feltétlenül lesz unique. A hash-t arra
> használnám, hogy POI-kat azonosítsak be vele, típus és a cím alapján. Ez
> nem kerül a db-be. Viszont szerintetek egy ref:-et elhelyezhetek-e a db-be,
> ami a saját azonosító, ami mondjuk egy nullától növekvő szám.
>
> Az azonosítás módjai:
> 1) ref:<saját> - egy egyszerű ID ami az adatbázisban tároljuk és az
> OSM-ben is megvan (Saját DB és OSM)
> 2) osm id - Az összepárosított elemek OSM ID-it eltárolom (Saját DB és
> OSM-ben eleve megvan, de ez változhat)
> 3) hash - A hash ezt a saját DB-ben tárolom. Ha az OSM id alapján nem
> lehet megtalálni, akkor ha a cím nem változik a  POI-nak így meg lehetne
> találni a közelben. Például egy Spar-t node-ról way-re szerkesztes az OSM
> ID változni fog. Viszont ha a címe nem változik akkor így talán meg lehet
> találni.
> 4) latlong - A saját DB-ben tárolok egy adatforrásból származó
> geom_hint-et, és egy valódi OSM értéket is. Az eredeti listából ez
> kimaradt, de gondoltam jó ha beleírom, mert ez is lehet megoldás ha
> változik az OSM ID.
>
> Egyelőre ennyit gondoltam, ha gondoljátok hétfőn a Meetupon
> beszélgethetünk erről is. De addig is ha kérdés
>
> Üdvözlettel / Best Regards:
>
> Kálmán (KAMI) Szalai
>
> 2018. február 14. 9:09 Thomas Nagy írta, <bkil.hu at gmail.com>:
>
>> Imrével értek egyet, miszerint ilyen random hash-et nem szabad az OSM
>> adatbázisba rakni. Más nem tudja értelmezni vagy használni, ha szerkesztik
>> az pedig neked el is rontja a játékodat, read-only attribútumoknak újra
>> csak nincs haszna.
>>
>> A külön git repó nekem is tetszik. Én a hash mellett még egy koordinátát
>> is belementenék. Akár nevet is lehetne, és akkor a lokális környezetben a
>> fuzzy search kizárásos alapon elég jól hozzá tudná rendelni még akkor is,
>> ha néhánynak változik a neve.
>>
>> Igazi UUID-t nehéz találni a cégjegyzékszám és adószámon kívül, bár
>> felvásárlások után még ha jogilag már meg is változik egy POI, az emberek
>> fejében sokszor él a logikai átmenet ha az új cég majdnem ugyanazt csinálja
>> (lásd büfék). Szóval a legtöbb ember inkább a 3D koordinátát tartja
>> UUID-nek. Azt könnyű elfogadni hogyha egy bolt elköltözik a következő
>> sarokra akkor az másik. Ehhez a címen kívül kell még a level=* is ami a
>> harmadik dimenzióban egyértelműsít. Vagy épületen/plázán belül
>> ajtó/szoba/térrész azonosító is kell a házszámon felül, ami nem mindig áll
>> rendelkezésre, bár legalább 3 frissen bejárt plázában találtam ilyet is
>> kifüggesztve.
>>
>>
>> On Sunday, February 11, 2018 at 12:17:55 PM UTC+1, KAMI KAMI wrote:
>>>
>>>
>>> Sziasztok,
>>>
>>> Szeretnék veletek ötletelni, hogy hogyan lehetne a POI-kat összerendelni
>>> az OSM_ID-vel. Szeretném, ha a db-be importált adatok (weboldalról
>>> feldolgozott POI-k) és a hozzájárulók által megadott osm id<-> poi
>>> összerenedeléseket külön táblában tárolni. Szerintetek erre mi lenne a
>>> legjobb összerendelési megoldás. Az a baj, hogy az osm poi-kon nincs semmi
>>> egyedi azonosító, ami alapján be lehetne azonosítani (az osm id azért
>>> változhat).
>>>
>>> Mivel a a cím teljes kitöltése a cél, ezért arra gondoltam, hogy a poi
>>> típusából és a címből (kisbetűssé alakítva és space-ktől mentes) képzett
>>> hash alapján lenne az osm id-vel történő összerendelés. Ez szerintetek
>>> megfelelő lenne? A cél az az lenne, hogy a nulláról újra generált db esetén
>>> is meg lehessen találni a POI-kat. Tervezett hash algoritmus SHA512.
>>>
>>> Illetve az lenne a kérdésem, hogy szerintetek a poi-hoz el "szabad"
>>> helyezni valami azonosítót, ami még egy lehetőség lehetne a POI biztosabb
>>> megtalálásához?
>>>
>>> Előre is köszönöm!
>>>
>>> Üdvözlettel / Best Regards:
>>>
>>> Kálmán (KAMI) Szalai
>>>
>> --
>> Magyar OSM Levelezőlista - openstreetmap-hungary at googlegroups.com
>> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com
>> ---
>> Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok
>> „openstreetmap-hungary” csoportjára.
>> Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való
>> leiratkozáshoz küldjön egy e-amailt a(z) openstreetmap-hungary+unsubscr
>> ibe at googlegroups.com címre.
>> További lehetőségekért látogasson el ide: https://groups.google.com/d/op
>> tout.
>>
>
> --
> Magyar OSM Levelezőlista - openstreetmap-hungary at googlegroups.com
> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com
> ---
> Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok
> „openstreetmap-hungary” témájára.
> A témáról való leiratkozáshoz látogasson el a következő címre:
> https://groups.google.com/d/topic/openstreetmap-hungary/
> mLbRG5F1hVg/unsubscribe.
> Az erről a csoportról és minden témájáról való leiratkozáshoz küldjön egy
> levelet a következő címre: openstreetmap-hungary+
> unsubscribe at googlegroups.com.
> További lehetőségekért látogasson el ide: https://groups.google.com/d/
> optout.
>
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.openstreetmap.org/pipermail/talk-hu/attachments/20180214/bfbbbabd/attachment.htm>


További információk a(z) Talk-hu levelezőlistáról