Re: [osm-hu] Re: Poi és osm id-k

Tamás Vásony vasony.tamas at gmail.com
2018. Feb. 28., Sze, 21:45:32 UTC


Sziasztok!

Ahogy régebben kifejtetem (akkor nem volt ellenvetés), az irányítószámok
"gazdája" a posta, ő viszi a leveleket akármit is állítanak a cégek a
honlapukon, 99.9%-ban a posta a referencia.
Ezen elv mentén van lejavítva az egész Budapest, sőt az egész ország, tehát
a Campona is. Tehát *1223.*
https://www.openstreetmap.org/way/105668758


Én is betöltöttem a listát és ráengedtem a céges címparsolót, amiből 1-2
dolog kijött
A több mint 10 éves tapasztalat azt mutatja, hogy nem lehet (nem érdemes)
megoldani 100%-algoritmikusan a cím szétdobását.

Két módszer vált be
1)  algoritmus + az eredmény kézi helyretevése (itt gyakorlatilag az
jelentené, hogy egyszer szét kell szedni, aztán kézi erővel kiszedegetni a
rosszakat, vagy itt vagy a már betöltött adatokban), ennek hátránya, hogy
az input változásakor nem lehet felülcsapni
2) algoritmus + cseretábla
A cseretáblás módszer:
- 99%-ot előállít az algoritmus, de van egy javító tábla (ami kézi munka)
ami a maradékot helyreteszi, ebben csak a rosszul szétszedett címek jól
szétszedett tagjai szerepelnek (ugyanazok a mezők mint a poi listában), ha
a szétszedő talál ebben a táblában értéket, akkor csak innen kiolvassa a
tagokat, egyéb esetben saját feje után megy
- 100%-ban javítótábla van, amit a szétszedő algoritmus tölt fel. Ebben
lehet javítgatni a rossz szétszedéseknél, nem függ az inputtól, ha új input
jön az először ide leképeződik. Ebben az összes cím szétszedett változata
megtalálható


Amilyen probléma típusokat találtam, pár dolog már szerepelt.
- "Szemét" az elején, pl:  BEVÁSÁRLÓ UTCA 2. (AUCHAN), ezt az algoritmus jó
kezeli
- "Szemét a végén, pl: SOSTÓI IPARI PARK, HOLLAND FASOR 2. (AUCHAN), itt
azt első részt megtarja
- Dupla cím, pl: BALATONI ÚT 000853/15. HRSZ. (KÉRŐ UTCA 1.) Itt az elsőt
veszi, pedig pl. a Kérő utca 1 jobb lenne
- Sarok címek: KISS TÁBORNOK - KANDÓ KÁLMÁN UTCA SAROK (ez pld addr:
mezőkbe szerintem fölösleges bevezetni ahogy most van)
- Főút, autópályas, stb.. M0 AUTÓPÁLYA 6 KM. SZELV.  (ezt is felesleges,
nem is történt meg a cím kitöltése)
- Nem valós cím: FLÓRIÁN TÉRI ALULJÁRÓ, 11.SZ.ÜZLET (Ez ugyan egyértelmű
egy humánnak, viszont olyan utca nincs hogy Flórián téri aluljáró)

Érdemes egyáltalán elgoldolkodni, hogyha nem szerepel házszám vagy hrsz. a
címben, akkor azokat mennyire érdemes használni.

Később még lesz időm, akkor tovább tudom elemezni, hogy az adott cím
szerepel-e az OSM-ben vagy sem, illetve milyen eltérések vannak az
írásmódokban.

Tamás


2018-02-28 20:18 GMT+01:00 Sándor Erdődy <erdodysandor at gmail.com>:

> Én is letöltöttem KAMI listáját.
>
> A budapest XXII. kerületi címeket nézegettem. Vannak eltérések.
> A kerület egyik legismertebb építménye a Campona bevásárló központ, címe: 1222
> Nagytétényi út 37
> <https://maps.google.com/?q=1222+Nagyt%C3%A9t%C3%A9nyi+%C3%BAt+37&entry=gmail&source=g>
> -43.
> Most a Posta honlapján elérhető irányítószám kereső a következőt dobja ki:
>
>  Budapest XXII. Közterület: Nagytétényi út 27
> <https://maps.google.com/?q=Nagyt%C3%A9t%C3%A9nyi+%C3%BAt+27&entry=gmail&source=g>
> .-53. Irányítószám:1223
>
> üdv.
> Erdődy Sándor
>
> --
> Magyar OSM Levelezőlista - openstreetmap-hungary at googlegroups.com
> leiratkozás: openstreetmap-hungary+unsubscribe at googlegroups.com
> ---
> Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok
> „openstreetmap-hungary” csoportjára.
> Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való
> leiratkozáshoz küldjön egy e-amailt a(z) openstreetmap-hungary+
> unsubscribe at googlegroups.com címre.
> További lehetőségekért látogasson el ide: https://groups.google.com/d/
> optout.
>
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.openstreetmap.org/pipermail/talk-hu/attachments/20180228/80ca388e/attachment.htm>


További információk a(z) Talk-hu levelezőlistáról