[Talk-cz] rúian bot - první výsledky testů

Mirek Dlask dlask.m na gmail.com
Úterý Srpen 7 21:50:12 UTC 2012


Chajdy jsou na webu OK.

*
Definiční bod adresního místa
ID 1857484
FID 80901527
DOMOVNICISLO 102
TYPDOMCISLA 2
ORIENTACNICISLO
PARCELNICISLO 1575
PARCELAPODLOMENI 4
DRUHPARCCISLA 2
KODKATASTRU 669857
NAZEVULICE
NAZEVOBCE KOSMONOSY
IDOB 1030274321
CUZKBUD_ID 0
IDADR 30019308531
ULICE_ID
PSC 29306
CASTOBCE Kosmonosy



Definiční bod adresního místa
ID 2655618
FID 22030160
DOMOVNICISLO 175
TYPDOMCISLA 2
ORIENTACNICISLO
PARCELNICISLO 1575
PARCELAPODLOMENI 13
DRUHPARCCISLA 2
KODKATASTRU 669857
NAZEVULICE
NAZEVOBCE KOSMONOSY
IDOB 1030275327
CUZKBUD_ID 373189207
IDADR 30015238474
ULICE_ID
PSC 29306
CASTOBCE Kosmonosy

Ještě jsem narazil na jeden problém - dvě skoro stejná čp.
Mladá Boleslav, Hwiezdoslavova 699/11
Mladá Boleslav, tř. Václava Klementa 699

Nám asi nevadí...

Ač nejsem Boleslavák, nějak moc se v ní poslední dobou rýpu ;-)

Mirek
*

Dne 7. srpna 2012 23:13 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):

>  Dne 7.8.2012 21:43, Mirek Dlask napsal(a):
>
> Díky za hodně zajímavé výstupy.
>
>
> díky za skvělou analýzu. díky ní jsem narazil na další problémy, které
> jsem přehlídnul a je potřeba je vyřešit.
>
>
> Že se liší OSM od RÚIAN není překvapení, ale rozdíl mezi RÚIAN a KM je
> zarážející. Čekal bych, že používají stejná data, ale zjevně tomu tak není.
>
>  Všechny body v Doksech, které nejsou v RÚIAN jsou v KM i OSM
>
>
> hledal jsem, kde je problém, a našel jsem příčinu. v rúian je celkem
> 205488 adresních bodů (z celkových 2915347), které nemají definované
> souřadnice. z toho vyplývá, že když udělám do db dotaz na určitý bounding
> box, tak tyhle ve výsledném seznamu chybí.
>
> je otázka, jak tohle pořešit. osm definice adresního bodu typu POINT(14.6523938
> 50.5632938) CZ, null null, null 948 není z adresního hlediska moc
> jednoznačná :-) nicméně z rúian db by mělo jít vytáhnout, v jaké obci se
> bod nachází (podle osm souřadnic), takže bych měl dostat identifikaci obec
> - číslo. s tím už by mělo být ve většině případů asi možné body jednoznačně
> napárovat.
>
>  Zkoušel jsem dva body z Kosmonos. Tam pro změnu jsou v RÚIAN, ale v KM
> jsou domečky/chatičky bez čp/če.
>
>
> a jak je to na webu čúzk v nahlížení do kú?
>
>  Čemu nerozumím.
> POINT(14.9199488 50.4377038) CZ, 29306 Kosmonosy, Květinová 979 má
> protějšek
> http://www.openstreetmap.org/browse/node/1238703135/history přesně na
> místě jako v KM, tedy na ulici ;-)
> Přesto, že má protějšek, je  v Not matched RÚIAN addresses:
> Znamená to, že je příliš vzdálen?
> Neměl by být onen protějšek v  Not matched OSM addresses: ?
> Nebo by byl vymazán?
>
>
> tady je problém v bounding boxu. jelikož jsme definovali bounding box jako BOX(14.9
> 50.41,14.92 50.44) a bod z osm je mimo něj (50.4375975, *14.9201675*),
> tak se body nepotkaly (export z osm api mi bod nedal, protože je mimo
> bbox). v praxi by bot nejdřív načetl body z celé čr (z osm i z rúian db),
> takže k tomuhle problému by dojít nemělo.
>
>  Nekonzistence dat vypadá takto
> Not matched OSM addresses:
> POINT(14.9130038 50.4308788) CZ, null null, null 1396
>
> Duplicity to selektí skvěle.
>
>
> jak jsem psal jinde, budu muset ještě upravit párování, aby se vždy
> párovaly nejbližší body. teď to záleží na pořadí bodů v osm. tj pokud mají
> oba duplicitní body stejné adresní informace a vzdálenější bod je v exportu
> z osm api před bližším, tak se rúian bod spáruje s tím vzdálenějším. ta
> úprava ale nebude mít vliv na body, které jsou sice duplicitní, ale
> kvalitativně rozdílné. tj pokud jeden z duplicitních bodů má např. navíc
> správně ulici a druhý ne, tak se na rúian bod napáruje první bod, i kdyby
> byl dál než ten bez ulice.
>
>
> Ještě jeden zajímavej bod
> POINT(14.9097779 50.4360764) CZ, 293 06 null, Na Radouči 1326
> Na něm je připíchnutá lékárna, čímž není vidět čp. (docela blbý ne? pro
> navigace asi OK)
> http://www.openstreetmap.org/browse/node/1781453132/history
>
>
> z pohledu renderování amenity přímo na adresním bodě asi není zrovna
> ideální. další problém určitě nastává v případě, kdy je na adrese víc
> různých amenity, ale namapovat jde tímhle způsobem jen jedna. na druhou
> stranu je z toho naprosto zřejmá adresa daného amenity. jak se tohle v
> praxi řeší, aby amenity mělo i adresu ale současně nebylo adresním bodem?
> bot by eventuelně mohl z bodů extrahovat amenity a posunout je třeba o
> metr, aby nedocházelo k tomuhle jevu. pokud ovšem budeme chtít.
>
>  Navíc na stejné budově je další nekonzistence
> http://www.openstreetmap.org/browse/node/1238706528/history
>
>  Zakončím pozitivní zprávou.
> Na této budově je ještě jeden adresní bod, který je na stejném místě v
> OSM, KM i RÚIAN.
>
>
>  Mirek
>
>
> ff
>
>
>  Dne 6. srpna 2012 19:27 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):
>
>>  v příloze posílám log z bota. tady pak ještě výtah z logy pro ty, kterým
>> se nebude chtít zip otevírat:
>>
>> Loaded 1 632 OSM nodes
>> Loaded 2 044 RÚIAN nodes
>> Matching nodes by full address...
>> 0 nodes matched
>> Matching nodes by street...
>> Matched RÚIAN node POINT(14.901064 50.4144003) CZ, 29301 Mladá Boleslav,
>> Ptácká 28/29 and OSM node POINT(14.9009875 50.4211801) CZ, null null,
>> Ptácká 28/29 but their distance 0,0067802 is over the limit 0,005
>> Matched RÚIAN node POINT(14.9009205 50.4145706) CZ, 29301 Mladá Boleslav,
>> Ptácká 295 and OSM node POINT(14.9001738 50.4229025) CZ, null null, Ptácká
>> 295 but their distance 0,0083653 is over the limit 0,005
>> Matched RÚIAN node POINT(14.9043758 50.4183866) CZ, 29301 Mladá Boleslav,
>> Folprechtova 1259 and OSM node POINT(14.9031463 50.4242688) CZ, null null,
>> Folprechtova 1259 but their distance 0,0060093 is over the limit 0,005
>> 1 398 nodes matched
>> Matching nodes by conscription/provisional number...
>> Matched RÚIAN node POINT(14.9063657 50.4280101) CZ, 29301 Mladá Boleslav,
>> U stadionu 983 and OSM node POINT(14.919441 50.4385282) CZ, null null,
>> Jižní 983 but their distance 0,0167808 is over the limit 0,005
>> Matched RÚIAN node POINT(14.901064 50.4144003) CZ, 29301 Mladá Boleslav,
>> Ptácká 28/29 and OSM node POINT(14.9009875 50.4211801) CZ, null null,
>> Ptácká 28/29 but their distance 0,0067802 is over the limit 0,005
>> Matched RÚIAN node POINT(14.9009205 50.4145706) CZ, 29301 Mladá Boleslav,
>> Ptácká 295 and OSM node POINT(14.9001738 50.4229025) CZ, null null, Ptácká
>> 295 but their distance 0,0083653 is over the limit 0,005
>> Matched RÚIAN node POINT(14.9059945 50.4299041) CZ, 29301 Mladá Boleslav,
>> Na Radouči 1078 and OSM node POINT(14.9109589 50.4126665) CZ, null null,
>> Třída T. G. Masaryka 1078 but their distance 0,0179382 is over the limit
>> 0,005
>> Matched RÚIAN node POINT(14.9043758 50.4183866) CZ, 29301 Mladá Boleslav,
>> Folprechtova 1259 and OSM node POINT(14.9031463 50.4242688) CZ, null null,
>> Folprechtova 1259 but their distance 0,0060093 is over the limit 0,005
>> Matched RÚIAN node POINT(14.9091991 50.4195372) CZ, 29301 Mladá Boleslav,
>> Palackého 1396 and OSM node POINT(14.9130038 50.4308788) CZ, null null,
>> null 1396 but their distance 0,0119628 is over the limit 0,005
>> 202 nodes matched
>> Total matched nodes: 1 600
>> Total unmatched nodes - RÚIAN: 444, OSM: 32
>> Maximum matched node distance: 0,0023727 (RÚIAN: POINT(14.9013315
>> 50.422053) CZ, 29301 Mladá Boleslav, Pod skalou 303 OSM: POINT(14.9006775
>> 50.4243338) CZ, null null, Pod Skalou 303)
>>
>> ff
>>
>>
>>
>>
>
> _______________________________________________
> Talk-cz mailing listTalk-cz na openstreetmap.orghttp://lists.openstreetmap.org/listinfo/talk-cz
>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120807/2295cf92/attachment.html>


Další informace o konferenci talk-cz