[Talk-cz] rúian bot - první výsledky testů

Miroslav Šulc fordfrog na fordfrog.com
Pondělí Srpen 6 17:07:41 UTC 2012


Dne 6.8.2012 16:04, Jan Bilak napsal(a):
> Ahoj,
>
> jak ten bot rychlý? Aneb za jak dlouho by zpracoval (pokusně) celou ČR
> - tedy vygeneroval log?
no, chvíli by mu to asi trvalo, ale v tom nevidím problém. až budu mít
aspoň trochu jistotu, že z toho nepolezou bláboly, tak to můžu zkusit na
celé čr. akorát mám trochu obavy z toho, že ten log bude až moc velký.
> Můžeš udělat histogram vzdáleností spárovaných bodů?

nad tímhle už jsem přemýšlel. zkusím to rozdělit po nějakých rozumných
intervalech a přidám to do těch výstupních statistik.

> Honza
ff
>
>
> Dne 6. srpna 2012 4:54 Mirek Dlask <dlask.m na gmail.com> napsal(a):
>> Je otázka, zda nejsou v RÚIAN adresní body domů bez č.p. , asi tam budou
>> adresní body rozestavěných domů. Ty v OSM předpokládám nejsou.
>> Nebo by se asi zobrazovaly tečky bez čísel!?
>>
>> Buď zkusit zmenšit boxík na nějaké garáže, nebo průmysl bez č.p. ,
>> nebo SELECT adresních bodů bez čísel popisných a zároveň evidenčních,
>> jsou-li ...
>>
>>
>>
>> 150 je fakt nějak moc
>>
>> Mirek
>>
>> Dne 5. srpna 2012 23:30 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):
>>> tak jsem dodělal bota do stádia, že načte body z osm api a z rúian db,
>>> pokusí se je spárovat a vygeneruje nějaké statistiky. pokud se někdo chce
>>> podívat do kódu, tak je k dispozici na https://github.com/fordfrog/ruian2osm
>>>
>>> co se týče načítání bodů z api, tak jsem to omezil na nody, které mají tag
>>> addr:housenumber a tag addr:country=CZ (doufám, že adresní body v čr mají
>>> aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).
>>>
>>> pro testy jsem použil BOX(14.63 50.55,14.68 50.58).
>>>
>>> pro párování bodů jsem nastavil maximální povolenou vzdálenost na 0.005,
>>> nicméně největší vzdálenost mezi shodnými body je 0,0009538 (RÚIAN:
>>> POINT(14.6562825 50.5617608) CZ, Doksy, Hálkova 890 OSM: POINT(14.6553375
>>> 50.5616313) CZ, null, Hálkova 890,
>>> http://maps.fordfrog.com/?zoom=18&lat=50.56166&lon=14.65557&layers=0B0FTF).
>>> u tohohle bodu je zajímavé, že údaj v kú je jiný než údaj v rúian (je to
>>> vidět z kú vrstvy, u nás ale zatím neproběhla digitalizace).
>>>
>>> co se týče propojování, tak úspěšnost byla následující:
>>> Total matched nodes: 1 136
>>> Total unmatched nodes - RÚIAN: 150, OSM: 15
>>>
>>> z toho mj vyplývá, že pokud jsem nikde neudělal chybu, tak v dané oblasti
>>> je oproti rúian navíc 15 adresních bodů a 150 jich chybí (což je opravdu
>>> dost na tak malé území, aspoň podle mě).
>>>
>>> k párování ještě poznámka. to že se body sprárovaly ještě neznamená, že
>>> osm obsahuje kompletní adresy. jak jsem psal jinde, u nás kompletně chybí
>>> addr:city, součástí adresy není ani addr:postcode. párování probíhá v
>>> několika cyklech, nejdříve podle celé adresy, nespárované body se pak
>>> porovnávají podle ulice a čísla, a to co zbyde se nakonec porovná pouze
>>> podle čísla. ve všech případech se ještě zohledňuje vzdálenost bodů. pro
>>> programátory podrobnější info tady:
>>> https://github.com/fordfrog/ruian2osm/blob/next_release/src/main/java/com/fordfrog/ruian2osm/AddressNodesMatcher.java
>>>
>>> tady je ještě údaj o průměrné vzdálenosti propojených bodů:
>>> Average matched node distance: 0,0000046
>>>
>>> v příloze posílám (snad proleze zip) kompletní log z bota. uvítal bych,
>>> pokud by se někdo na ten log podíval, jestli tam nenajde ještě něco
>>> zajímavého (nějaké zjevné chyby, na co si dát pozor apod.). stejně tak,
>>> pokud budete někdo chtít, abych pustil bota (samozřejmě pouze v testovacím
>>> režimu) na nějaké vaší oblíbené oblasti, tak mi pošlete bounding box a já
>>> vám pošlu log z bota.
>>>
>>> ff
>>>
>>> _______________________________________________
>>> Talk-cz mailing list
>>> Talk-cz na openstreetmap.org
>>> http://lists.openstreetmap.org/listinfo/talk-cz
>>>
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> http://lists.openstreetmap.org/listinfo/talk-cz
>>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz


------------- další část ---------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 4475 bytes
Desc: Elektronicky podpis S/MIME
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120806/05d75f0b/attachment.bin>


Další informace o konferenci talk-cz