[Talk-cz] rúian bot - první výsledky testů

Mirek Dlask dlask.m na gmail.com
Pondělí Srpen 6 02:54:09 UTC 2012


Je otázka, zda nejsou v RÚIAN adresní body domů bez č.p. , asi tam budou
adresní body rozestavěných domů. Ty v OSM předpokládám nejsou.
Nebo by se asi zobrazovaly tečky bez čísel!?

Buď zkusit zmenšit boxík na nějaké garáže, nebo průmysl bez č.p. ,
nebo SELECT adresních bodů bez čísel popisných a zároveň evidenčních,
jsou-li ...



150 je fakt nějak moc

Mirek

Dne 5. srpna 2012 23:30 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):

>  tak jsem dodělal bota do stádia, že načte body z osm api a z rúian db,
> pokusí se je spárovat a vygeneruje nějaké statistiky. pokud se někdo chce
> podívat do kódu, tak je k dispozici na
> https://github.com/fordfrog/ruian2osm
>
> co se týče načítání bodů z api, tak jsem to omezil na nody, které mají tag
> addr:housenumber a tag addr:country=CZ (doufám, že adresní body v čr mají
> aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).
>
> pro testy jsem použil BOX(14.63 50.55,14.68 50.58).
>
> pro párování bodů jsem nastavil maximální povolenou vzdálenost na 0.005,
> nicméně největší vzdálenost mezi shodnými body je 0,0009538 (RÚIAN:
> POINT(14.6562825 50.5617608) CZ, Doksy, Hálkova 890 OSM: POINT(14.6553375
> 50.5616313) CZ, null, Hálkova 890,
> http://maps.fordfrog.com/?zoom=18&lat=50.56166&lon=14.65557&layers=0B0FTF).
> u tohohle bodu je zajímavé, že údaj v kú je jiný než údaj v rúian (je to
> vidět z kú vrstvy, u nás ale zatím neproběhla digitalizace).
>
> co se týče propojování, tak úspěšnost byla následující:
> Total matched nodes: 1 136
> Total unmatched nodes - RÚIAN: 150, OSM: 15
>
> z toho mj vyplývá, že pokud jsem nikde neudělal chybu, tak v dané oblasti
> je oproti rúian navíc 15 adresních bodů a 150 jich chybí (což je opravdu
> dost na tak malé území, aspoň podle mě).
>
> k párování ještě poznámka. to že se body sprárovaly ještě neznamená, že
> osm obsahuje kompletní adresy. jak jsem psal jinde, u nás kompletně chybí
> addr:city, součástí adresy není ani addr:postcode. párování probíhá v
> několika cyklech, nejdříve podle celé adresy, nespárované body se pak
> porovnávají podle ulice a čísla, a to co zbyde se nakonec porovná pouze
> podle čísla. ve všech případech se ještě zohledňuje vzdálenost bodů. pro
> programátory podrobnější info tady:
> https://github.com/fordfrog/ruian2osm/blob/next_release/src/main/java/com/fordfrog/ruian2osm/AddressNodesMatcher.java
>
> tady je ještě údaj o průměrné vzdálenosti propojených bodů:
> Average matched node distance: 0,0000046
>
> v příloze posílám (snad proleze zip) kompletní log z bota. uvítal bych,
> pokud by se někdo na ten log podíval, jestli tam nenajde ještě něco
> zajímavého (nějaké zjevné chyby, na co si dát pozor apod.). stejně tak,
> pokud budete někdo chtít, abych pustil bota (samozřejmě pouze v testovacím
> režimu) na nějaké vaší oblíbené oblasti, tak mi pošlete bounding box a já
> vám pošlu log z bota.
>
> ff
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120806/14736f2b/attachment.html>


Další informace o konferenci talk-cz