Re: [osm-hu] földrajzi névtér
István Szakadát
i at syi.hu
2015. Már. 18., Sze, 14:16:26 UTC
Köszönöm az eddigi válaszokat, és elnézést kérek, de azért nem reagáltam
korábban, mert azt hittem, a válaszokat megkapom majd emailben.
Én nem akarok semmilyen reformot az osm-ben, sőt, még tölteni sem nagyon
akarok adatokat saját kezemmel, de persze azt szeertném, ha a most építendő
földrajzi névtér és az osm között ki lehetne építeni egy kétirányú
adatcsere-folymatot. Ezért kérdeztem, kérdezek bármit is. Értem, hogy az
osm-ben vannak kialakult szokások, amiket nem lehet vagy csak nagyon
nehezen és lassan lehet megváltoztani. A névkezelés problémájára
válaszoltatok, rendben, értem, nem érdemes "flame war"-ba belemenni az
egységes névkezelés érdekében. Ehhez hasonló problémát érzek abban, hogy az
osm-be milyen wikipedia-linkeket kell/lehet beleírni. Én az elmúlt hetekben
bedolgoztam a névtérbe az erdélyi magyar településneveket és ezzel
belekerültek a róluk magyar wiki-oldalak címei is. Egy-két esetben
megnéztem, és úgy látom, hogy a romaániai településekhez még nem kapcsolták
hozzá a wiki-linkeket. Szemben a magyarországi településekkel, amelyek
esetében viszont nagyon szépen beépítettétek már ezeket a kapcsolatokat. Én
most azt szerentém, hogy az erdélyi településekhez hozzákapcsoljam az
osm-azonosítóikat (ezért lenne fontos a relation-ok id-it a településekhez
rendelni, hogy egynemű lehessen az adatbázis ebben a tekintetben. Ha ez
meglenne, akkor egy mozdulattal oda tudnám adni nektek (az osm-közösségnek)
az erdélyi magyar települések wp-címeit is, ami nagy előrelépést
jelenthetne. De ezek a magyar nyelvű wp-címek. Ha ezt ti betennétek, esély
lenne rá, hogy román oldalról kiveszik ezeket mondván, hogy a román címeket
kéne inkább beírni (a nevek mintájára)? Erre lehetne megoldás, hogy
wikidata-azonosítókat ír be az osm, és akkor el leeht kerülni az ilyen
vitákat, de azt nem látom, mi a tényleges helyzet a jelenben ebben a
kérdésben.
A mostani fázisban mi azt szeretnénk, hogy a névtér földrajzi helyeihez
hozzárendeljük az osm azonosítókat, hogy megteremtsük a kapcsolatot a két
rendszer között. Amikor ez megvan, akkor derülhet ki, hogy milyen neveink
vannak, amelyek nincsenek benne az osm-ben. Ezeket nyilván odaadjuk nektek,
hogy bekerülhessenek az osm-be, és utána ezek osm-azonosítóit visszakapva
becsatolhassuk azokat is a névtérbe. Harmadik fázisban kell majd kidolgozni
az a kétirányú figyelő és adatcserérő rendszert, amely a kétféle rendszerbe
került új adatokat jelz és küldi valahogy a másik irányba. Ez még odébb
van. Most a névtér adatbázisát építjük a saját logikánk szerint, és közben
építjük bele az osm-kapcsolatokat, ahol tudjuk.
A jelenlegi névtérben (kb 28 ezer tétel) egyfelől a magyarországi
településnevek és a KSH által nyilvántartott településrésznevek vannak
benne. Ezek nagyon nagy része wp-címekkel is el van látva. A települések
időbeli változásai is 80-90 százalékos arányban megvannak a KSH
Helységnévtára alapján (1900-ig visszamenőleg). Ez nagy nóvuma ennek a
rendszernek, persze hihetetlen nehéz az változásokat pontosan nyomon
követni, de idő van rá. Egyelőre az a fontos, hogy a rendszerben benne van
az időbeliség kezelésének lehetősége. Nincsenek még benne a járás- és
megyei besorolások változásai az időben visszamenőleg. Ez viszont
beszerezhető és nem túl nagy munkával beépíthető az adatbázisba.
Benne vannak még az erdélyi magyar települések is megyék alá rendelten,
strukturálva, de az időeli változások nélkül, viszont wp-címekkel ellátva.
Most fejezem be napokon belül Varga E. Árpád helynévtárának bedolgozását
is, ami többféle kapcsolódási lehetőséget is megteremt, de ez más ügy miatt
fontos.
A mostani névtérben megvannak ugyan a további elcsatolt területek magyar
településnevei, de ezek még nincsenek felettes kapcsolatokkal ellátva,
tehát még nem kerültek be a struktúrába. Jó lenne ugyanúgy a wikipédia
adatokat feldolgozni és a struktúrát és meg perse wp-címeket is ugyanúgy
hozzárendelni a névtér megfelelő opntjaihoz, csak épp most mást kell majd
csinálnom. A történelmi Mo. teleplésnevei egyébként struktúráltan megvannak
a Geotauruszban, amit a most következő körben szeretnék egybeintegrálni a
jelenlegi névtérállománnyal.
A Geotaurusz a földrajzi nevek tezaurusz logika alapján rendezett
rendszere, amit a nagyobb könyvtárak használnak elég régóta a dokumentumaik
leírására. 70-80 ezer tétel van benne (ebben elég sok nemzetközi név is
van, hiszen ha egy könyv Afrikáról szól, akkor annak leírására kellett az
Afrika tárgyszó a Geotauruszba. A Geotaurusz integrálása a névtérhez nem
tűnik akkora munkának, mint elsőre hinni lehetne, mert két jól struktúrált
rendszerről van szó. Ebben viszont szerintem nem lesz olyan sok új elem,
ami az osm-ben ne lenne benne. A jelenlegi névtérhez képes a Geotauruszban
a nemzetközi adatokon túl többletinformációt jelentenek a
természetföldrajzi helynevek (tájak, folyók, vízek), meg bizonyos pontszerű
objektumok (pl. vasútállomások) nevei.
A nagy adatbővülést attól várhatjuk, hogyha a FÖMI földrajzi névtárának
adatai belekerülhetnek a névtérbe. Ez még mindig nyitott kérdés. Annak
ellenére az, hogy az OSZK már megkapta a FÖMI-től az aláírt
szerződésváltozatot erre az együttműködésre. De az OSZK addig nem írja alá,
amíg nem lesz egyértelmű a FÖMI számára, hogy egy nemzeti névtérnek csak
akkor van értelme, ha a benne levő adatok nyiltak. Nem világos, hogy a FÖMI
ezt hogyan értelmezni, ezért kell elmenni hozzájuk. Nem lenne jó, ha ebből
később támadna pereskedés a felek között. A névtér lényege tényleg az, hogy
minden érintett szereplő, aki bele akar szállni egy ilyen együttműködésbe,
szabadon viheti és a saját adatrendszerébe beépítheti a névtér azonosítóit,
hogy ezáltal biztosítsa a saját rendszere és a többi rendszer közti
átjárhatóságot (ennek példájaként már most meg tudjuk mutatni a működő
prototípusunkon, hogy egy kattintásal át lehet ugorni a névtér adott
pontjáról a KSH Helységnévtárába, ahol már a településekre vonatkozó
statisztikai adatokat lehet nézegetni. Azért lehet ezt megtenni, mert a KSH
Helységnévtára és a névtér között már - település szinten - kiépítettük az
összerendelést. Ha ezt megérti a FÖMI vezetése és el is fogadja (reméljük,
hogy így lesz), akkor a 78 ezres földrajzi névtár állománya beépülhet a
névtérbe, és akkor az onnan mehet át az osm-be. Ez a kérdés ezen a héten
eldőlhet. Reménykedjünk.
On Tuesday, March 17, 2015 at 10:43:06 PM UTC+1, Imre Samu wrote:
>
> A földrajzi névtérrel kapcsolatban van egy érdekes OSM közeli projekt az *OpenHistoricalMap.
> *
> [ Creating the world's most universal, detailed, and
> out-of-date map! ]
>
> [image: OpenStreetMap logó]
>
>
> Ennek célja régi - történelmi objektumok ( = múlt ) térképes adatbázisba
> történő felvitele.
> vagyis az elkészült földrajzi névtér adatokat célszerű lenne ide is
> betölteni.
>
> Az OHM felépítése lényegében az OSM-ével egyezik meg, kiemelve az "idő
> névtér" fontosságát, ami megadja az érvényességét az objektumnak!
>
> Projekt leírás és kiinduló:
> http://wiki.openstreetmap.org/wiki/Open_Historical_Map
>
> pár slide:
> - http://sotm-eu.org/slides/95-3.pdf
> -
> http://www.slideshare.net/gwhathistory/osm-and-online-time-machines-sotm-us-2012-pdx
> - http://www.slideshare.net/frankieroberto/mapp-history-on-open-street-map
>
> Levelezőlista : https://lists.openstreetmap.org/listinfo/historic
> itt az archives -ba érdemes belenézni - hogy hol is tart most a
> projekt:
> -> https://lists.openstreetmap.org/pipermail/historic/
>
>
>
>
> üdv,
> Imre
>
>
>
>
>
>
> 2015. március 13. 12:31 István Szakadát írta, <i... at syi.hu <javascript:>>:
>
>> Sziasztok,
>> a földrajzi névtér ügyében tartott legutóbbi megbeszélésünk során
>> felmerült kérdéseket szeretném folytatni.
>> Egyelőre segítséget kérek ahhoz, hogy a saját rendszerünkbe be tudjuk
>> építeni az osm azonosítóit. Ehhez az kell, hogy le tudjam tölteni a magyar
>> vonatkozású adatokat. Egy-két fogás megmutatását remélem, hogy minél
>> könnyebben megkaphassam a minket érdeklő adatokat. Ehhez kérnék segítséget
>> valakitől.
>>
>> Ami eddig nyilvánvaló: háromféle geoindividuumot kell kezelnünk (ami a
>> térinformatikában is megszokott: pont-, vonal- és poligonszerű
>> objektumokat). Első körben nekünk a poligonok a fontosak, utána jöhetnek
>> majd a vonal- és pontszerű entitások. Az OSM-en belül a poligonokat
>> többféle módon kezelik, amiben nekünk rendet kell majd tennünk. Az osm-ben
>> egy poligon elfordulhat relation-ként (ez a legjobb), de előfordulhat
>> magába záródó way-kent is (Romániában sok ilyet találtam), valamint lehet
>> pontként is hivatkozni rá. Az nem baj, és érthető, miélrt fordul elő, hogy
>> egy poligonszerű entitást vagy relation/way-megoldással vagy pontként
>> rögzítünk a térben (amíg nincs pologon, addig is eligazít a pontszerű
>> elhelyezés). Az zavaró nekem, hogy technikailag kétféel módon lehet egy
>> poligont az osm-ben reprezentálni (relation és way). A kérdés: van-e
>> szándék ezt egységesíteni? Ha igen, hogy lehetne. Ha az adatállomány
>> leválogatásában kapok esegítséget, akkor én szívesen felajánlom, hogy
>> visszaadjuk azokat az objektumokat, amelyekből relation-okat lehetne
>> csinálni, de én ezt a műveletet nem tudom (nem is akarom) elvégezni az
>> osm-ben.
>>
>> A másik kérdés: egy objektumnak kell adni egy nevet, és lehet más nyelvű
>> névváltozatokat is hozzárendelni. Attól függően, hogy melyik nyelvi
>> közösség készíti az obejektumot, az alaprételmezett "name" értéknek a saját
>> neyilvá változatát írja be. Ez az egységes lekérdezést nehezíti, szerintem
>> jobb lenne, ha mindig lenne egy nyelvi jelzés a name-label-ként. Megintcsak
>> a románai magyar települések esetén volt zavaró, hogy name-ként a román
>> nevek vannak beírva (mivel a román osm-önkéntesek vették fel őket), és a
>> magyar név már name:hu-ként volt hozzáragasztva. Ekkor tehát a "name"
>> értéke román volt, míg a magyarországi települések esetén "name" magyar
>> magyar jelölt. Érdemes-e itt egységesítést remélni, vagy a kontextusból
>> ekll mindig kiszámolni ezt az alapértelmezett háttérinformációt?
>> szi
>>
>> --
>> Magyar OSM Levelezőlista - openstreet... at googlegroups.com <javascript:>
>> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com
>> <javascript:>
>> ---
>> Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok
>> „openstreetmap-hungary” csoportjára.
>> Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való
>> leiratkozáshoz küldjön egy e-amailt a(z)
>> openstreetmap-hungary+unsubscribe at googlegroups.com <javascript:> címre.
>> További lehetőségekért látogasson el ide:
>> https://groups.google.com/d/optout.
>>
>
>
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.openstreetmap.org/pipermail/talk-hu/attachments/20150318/8e6cd4d4/attachment.htm>
További információk a(z) Talk-hu levelezőlistáról