Re: [osm-hu] földrajzi névtér

István Szakadát i at syi.hu
2015. Már. 18., Sze, 14:16:26 UTC


Köszönöm az eddigi válaszokat, és elnézést kérek, de azért nem reagáltam 
korábban, mert azt hittem, a válaszokat megkapom majd emailben. 
Én nem akarok semmilyen reformot az osm-ben, sőt, még tölteni sem nagyon 
akarok adatokat saját kezemmel, de persze azt szeertném, ha a most építendő 
földrajzi névtér és az osm között ki lehetne építeni egy kétirányú 
adatcsere-folymatot. Ezért kérdeztem, kérdezek bármit is. Értem, hogy az 
osm-ben vannak kialakult szokások, amiket nem lehet vagy csak nagyon 
nehezen és lassan lehet megváltoztani. A névkezelés problémájára 
válaszoltatok, rendben, értem, nem érdemes "flame war"-ba belemenni az 
egységes névkezelés érdekében. Ehhez hasonló problémát érzek abban, hogy az 
osm-be milyen wikipedia-linkeket kell/lehet beleírni. Én az elmúlt hetekben 
bedolgoztam a névtérbe az erdélyi magyar településneveket és ezzel 
belekerültek a róluk magyar wiki-oldalak címei is. Egy-két esetben 
megnéztem, és úgy látom, hogy a romaániai településekhez még nem kapcsolták 
hozzá a wiki-linkeket. Szemben a magyarországi településekkel, amelyek 
esetében viszont nagyon szépen beépítettétek már ezeket a kapcsolatokat. Én 
most azt szerentém, hogy az erdélyi településekhez hozzákapcsoljam az 
osm-azonosítóikat (ezért lenne fontos a relation-ok id-it a településekhez 
rendelni, hogy egynemű lehessen az adatbázis ebben a tekintetben. Ha ez 
meglenne, akkor egy mozdulattal oda tudnám adni nektek (az osm-közösségnek) 
az erdélyi magyar települések wp-címeit is, ami nagy előrelépést 
jelenthetne. De ezek a magyar nyelvű wp-címek. Ha ezt ti betennétek, esély 
lenne rá, hogy román oldalról kiveszik ezeket mondván, hogy a román címeket 
kéne inkább beírni (a nevek mintájára)? Erre lehetne megoldás, hogy 
wikidata-azonosítókat ír be az osm, és akkor el leeht kerülni az ilyen 
vitákat, de azt nem látom, mi a tényleges helyzet a jelenben ebben a 
kérdésben. 
A mostani fázisban mi azt szeretnénk, hogy a névtér földrajzi helyeihez 
hozzárendeljük az osm azonosítókat, hogy megteremtsük a kapcsolatot a két 
rendszer között. Amikor ez megvan, akkor derülhet ki, hogy milyen neveink 
vannak, amelyek nincsenek benne az osm-ben. Ezeket nyilván odaadjuk nektek, 
hogy bekerülhessenek az osm-be, és utána ezek osm-azonosítóit visszakapva 
becsatolhassuk azokat is a névtérbe. Harmadik fázisban kell majd kidolgozni 
az a kétirányú figyelő és adatcserérő rendszert, amely a kétféle rendszerbe 
került új adatokat jelz és küldi valahogy a másik irányba. Ez még odébb 
van. Most a névtér adatbázisát építjük a saját logikánk szerint, és közben 
építjük bele az osm-kapcsolatokat, ahol tudjuk.

A jelenlegi névtérben (kb 28 ezer tétel) egyfelől a magyarországi 
településnevek és a KSH által nyilvántartott településrésznevek vannak 
benne. Ezek nagyon nagy része wp-címekkel is el van látva. A települések 
időbeli változásai is 80-90 százalékos arányban megvannak a KSH 
Helységnévtára alapján (1900-ig visszamenőleg). Ez nagy nóvuma ennek a 
rendszernek, persze hihetetlen nehéz az változásokat pontosan nyomon 
követni, de idő van rá. Egyelőre az a fontos, hogy a rendszerben benne van 
az időbeliség kezelésének lehetősége. Nincsenek még benne a járás- és 
megyei besorolások változásai az időben  visszamenőleg. Ez viszont 
beszerezhető és nem túl nagy munkával beépíthető az adatbázisba.
Benne vannak még az erdélyi magyar települések is megyék alá rendelten, 
strukturálva, de az időeli változások nélkül, viszont wp-címekkel ellátva. 
Most fejezem be napokon belül Varga E. Árpád helynévtárának bedolgozását 
is, ami többféle kapcsolódási lehetőséget is megteremt, de ez más ügy miatt 
fontos. 
A mostani névtérben megvannak ugyan a további elcsatolt területek magyar 
településnevei, de ezek még nincsenek felettes kapcsolatokkal ellátva, 
tehát még nem kerültek be a struktúrába. Jó lenne ugyanúgy a wikipédia 
adatokat feldolgozni és a struktúrát és meg perse wp-címeket is ugyanúgy 
hozzárendelni a névtér megfelelő opntjaihoz, csak épp most mást kell majd 
csinálnom. A történelmi Mo. teleplésnevei egyébként struktúráltan megvannak 
a Geotauruszban, amit a most következő körben szeretnék egybeintegrálni a 
jelenlegi névtérállománnyal. 
A Geotaurusz a földrajzi nevek tezaurusz logika alapján rendezett 
rendszere, amit a nagyobb könyvtárak használnak elég régóta a dokumentumaik 
leírására. 70-80 ezer tétel van benne (ebben elég sok nemzetközi név is 
van, hiszen ha egy könyv Afrikáról szól, akkor annak leírására kellett az 
Afrika tárgyszó a Geotauruszba. A Geotaurusz integrálása a névtérhez nem 
tűnik akkora munkának, mint elsőre hinni lehetne, mert két jól struktúrált 
rendszerről van szó. Ebben viszont szerintem nem lesz olyan sok új elem, 
ami az osm-ben ne lenne benne. A jelenlegi névtérhez képes a Geotauruszban 
a nemzetközi adatokon túl többletinformációt jelentenek a 
természetföldrajzi helynevek (tájak, folyók, vízek), meg bizonyos pontszerű 
objektumok (pl. vasútállomások) nevei.
A nagy adatbővülést attól várhatjuk, hogyha a FÖMI földrajzi névtárának 
adatai belekerülhetnek a névtérbe. Ez még mindig nyitott kérdés. Annak 
ellenére az, hogy az OSZK már megkapta a FÖMI-től az aláírt 
szerződésváltozatot erre az együttműködésre. De az OSZK addig nem írja alá, 
amíg nem lesz egyértelmű a FÖMI számára, hogy egy nemzeti névtérnek csak 
akkor van értelme, ha a benne levő adatok nyiltak. Nem világos, hogy a FÖMI 
ezt hogyan értelmezni, ezért kell elmenni hozzájuk. Nem lenne jó, ha ebből 
később támadna pereskedés a felek között. A névtér lényege tényleg az, hogy 
minden érintett szereplő, aki bele akar szállni egy ilyen együttműködésbe, 
szabadon viheti és a saját adatrendszerébe beépítheti a névtér azonosítóit, 
hogy ezáltal biztosítsa a saját rendszere és a többi rendszer közti 
átjárhatóságot (ennek példájaként már most meg tudjuk mutatni a működő 
prototípusunkon, hogy egy kattintásal át lehet ugorni a névtér adott 
pontjáról a KSH  Helységnévtárába, ahol már a településekre vonatkozó 
statisztikai adatokat lehet nézegetni. Azért lehet ezt megtenni, mert a KSH 
Helységnévtára és a névtér között már - település szinten - kiépítettük az 
összerendelést. Ha ezt megérti a FÖMI vezetése és el is fogadja (reméljük, 
hogy így lesz), akkor a 78 ezres földrajzi névtár állománya beépülhet a 
névtérbe, és akkor az onnan mehet át az osm-be. Ez a kérdés ezen a héten 
eldőlhet. Reménykedjünk.


On Tuesday, March 17, 2015 at 10:43:06 PM UTC+1, Imre Samu wrote:
>
> A földrajzi névtérrel kapcsolatban van egy érdekes  OSM közeli projekt az *OpenHistoricalMap. 
>  *
>               [ Creating the world's most universal, detailed, and 
> out-of-date map! ]
>
> [image: OpenStreetMap logó]
>
>
> Ennek célja régi - történelmi objektumok ( = múlt )  térképes adatbázisba 
> történő felvitele.
> vagyis az elkészült földrajzi névtér adatokat célszerű lenne  ide is 
> betölteni.
>
> Az OHM felépítése lényegében az OSM-ével egyezik meg,  kiemelve az "idő 
> névtér" fontosságát,  ami megadja az érvényességét az objektumnak!
>
> Projekt leírás és kiinduló: 
>    http://wiki.openstreetmap.org/wiki/Open_Historical_Map
>
> pár slide:
> - http://sotm-eu.org/slides/95-3.pdf
> - 
> http://www.slideshare.net/gwhathistory/osm-and-online-time-machines-sotm-us-2012-pdx
> - http://www.slideshare.net/frankieroberto/mapp-history-on-open-street-map
>
> Levelezőlista : https://lists.openstreetmap.org/listinfo/historic
>     itt az archives -ba érdemes belenézni - hogy hol is tart most a 
> projekt:
>     -> https://lists.openstreetmap.org/pipermail/historic/
>
>
>
>
> üdv,
>  Imre
>
>
>
>  
>
>
> 2015. március 13. 12:31 István Szakadát írta, <i... at syi.hu <javascript:>>:
>
>> Sziasztok,
>> a földrajzi névtér ügyében tartott legutóbbi megbeszélésünk során 
>> felmerült kérdéseket szeretném folytatni.
>> Egyelőre segítséget kérek ahhoz, hogy a saját rendszerünkbe be tudjuk 
>> építeni az osm azonosítóit. Ehhez az kell, hogy le tudjam tölteni a magyar 
>> vonatkozású adatokat. Egy-két fogás megmutatását remélem, hogy minél 
>> könnyebben megkaphassam a minket érdeklő adatokat. Ehhez kérnék segítséget 
>> valakitől.
>>
>> Ami eddig nyilvánvaló: háromféle geoindividuumot kell kezelnünk (ami a 
>> térinformatikában is megszokott: pont-, vonal- és poligonszerű 
>> objektumokat). Első körben nekünk a poligonok a fontosak, utána jöhetnek 
>> majd a vonal- és pontszerű entitások. Az OSM-en belül a poligonokat 
>> többféle módon kezelik, amiben nekünk rendet kell majd tennünk. Az osm-ben 
>> egy poligon elfordulhat relation-ként (ez a legjobb), de előfordulhat 
>> magába záródó way-kent is (Romániában sok ilyet találtam), valamint lehet 
>> pontként is hivatkozni rá. Az nem baj, és érthető, miélrt fordul elő, hogy 
>> egy poligonszerű entitást vagy relation/way-megoldással vagy pontként 
>> rögzítünk a térben (amíg nincs pologon, addig is eligazít a pontszerű 
>> elhelyezés). Az zavaró nekem, hogy technikailag kétféel módon lehet egy 
>> poligont az osm-ben reprezentálni (relation és way). A kérdés: van-e 
>> szándék ezt egységesíteni? Ha igen, hogy lehetne. Ha az adatállomány 
>> leválogatásában kapok esegítséget, akkor én szívesen felajánlom, hogy 
>> visszaadjuk azokat az objektumokat, amelyekből relation-okat lehetne 
>> csinálni, de én ezt a műveletet nem tudom (nem is akarom) elvégezni az 
>> osm-ben.
>>
>> A másik kérdés: egy objektumnak kell adni egy nevet, és lehet más nyelvű 
>> névváltozatokat is hozzárendelni. Attól függően, hogy melyik nyelvi 
>> közösség készíti az obejektumot, az alaprételmezett "name" értéknek a saját 
>> neyilvá változatát írja be. Ez az egységes lekérdezést nehezíti, szerintem 
>> jobb lenne, ha mindig lenne egy nyelvi jelzés a name-label-ként. Megintcsak 
>> a románai magyar települések esetén volt zavaró, hogy name-ként a román 
>> nevek vannak beírva (mivel a román osm-önkéntesek vették fel őket), és a 
>> magyar név már name:hu-ként volt hozzáragasztva. Ekkor tehát a "name" 
>> értéke román volt, míg a magyarországi települések esetén "name" magyar 
>> magyar jelölt. Érdemes-e itt egységesítést remélni, vagy a kontextusból 
>> ekll mindig kiszámolni ezt az alapértelmezett háttérinformációt?
>> szi
>>
>>  -- 
>> Magyar OSM Levelezőlista - openstreet... at googlegroups.com <javascript:>
>> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com 
>> <javascript:>
>> --- 
>> Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok 
>> „openstreetmap-hungary” csoportjára.
>> Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való 
>> leiratkozáshoz küldjön egy e-amailt a(z) 
>> openstreetmap-hungary+unsubscribe at googlegroups.com <javascript:> címre.
>> További lehetőségekért látogasson el ide: 
>> https://groups.google.com/d/optout.
>>
>
>
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.openstreetmap.org/pipermail/talk-hu/attachments/20150318/8e6cd4d4/attachment.htm>


További információk a(z) Talk-hu levelezőlistáról