[Talk-cz] rúian bot - první výsledky testů

Jan Bilak jan.bilak.osm na gmail.com
Pondělí Srpen 6 14:04:40 UTC 2012


Ahoj,

jak ten bot rychlý? Aneb za jak dlouho by zpracoval (pokusně) celou ČR
- tedy vygeneroval log?

Můžeš udělat histogram vzdáleností spárovaných bodů?

Honza


Dne 6. srpna 2012 4:54 Mirek Dlask <dlask.m na gmail.com> napsal(a):
> Je otázka, zda nejsou v RÚIAN adresní body domů bez č.p. , asi tam budou
> adresní body rozestavěných domů. Ty v OSM předpokládám nejsou.
> Nebo by se asi zobrazovaly tečky bez čísel!?
>
> Buď zkusit zmenšit boxík na nějaké garáže, nebo průmysl bez č.p. ,
> nebo SELECT adresních bodů bez čísel popisných a zároveň evidenčních,
> jsou-li ...
>
>
>
> 150 je fakt nějak moc
>
> Mirek
>
> Dne 5. srpna 2012 23:30 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):
>>
>> tak jsem dodělal bota do stádia, že načte body z osm api a z rúian db,
>> pokusí se je spárovat a vygeneruje nějaké statistiky. pokud se někdo chce
>> podívat do kódu, tak je k dispozici na https://github.com/fordfrog/ruian2osm
>>
>> co se týče načítání bodů z api, tak jsem to omezil na nody, které mají tag
>> addr:housenumber a tag addr:country=CZ (doufám, že adresní body v čr mají
>> aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).
>>
>> pro testy jsem použil BOX(14.63 50.55,14.68 50.58).
>>
>> pro párování bodů jsem nastavil maximální povolenou vzdálenost na 0.005,
>> nicméně největší vzdálenost mezi shodnými body je 0,0009538 (RÚIAN:
>> POINT(14.6562825 50.5617608) CZ, Doksy, Hálkova 890 OSM: POINT(14.6553375
>> 50.5616313) CZ, null, Hálkova 890,
>> http://maps.fordfrog.com/?zoom=18&lat=50.56166&lon=14.65557&layers=0B0FTF).
>> u tohohle bodu je zajímavé, že údaj v kú je jiný než údaj v rúian (je to
>> vidět z kú vrstvy, u nás ale zatím neproběhla digitalizace).
>>
>> co se týče propojování, tak úspěšnost byla následující:
>> Total matched nodes: 1 136
>> Total unmatched nodes - RÚIAN: 150, OSM: 15
>>
>> z toho mj vyplývá, že pokud jsem nikde neudělal chybu, tak v dané oblasti
>> je oproti rúian navíc 15 adresních bodů a 150 jich chybí (což je opravdu
>> dost na tak malé území, aspoň podle mě).
>>
>> k párování ještě poznámka. to že se body sprárovaly ještě neznamená, že
>> osm obsahuje kompletní adresy. jak jsem psal jinde, u nás kompletně chybí
>> addr:city, součástí adresy není ani addr:postcode. párování probíhá v
>> několika cyklech, nejdříve podle celé adresy, nespárované body se pak
>> porovnávají podle ulice a čísla, a to co zbyde se nakonec porovná pouze
>> podle čísla. ve všech případech se ještě zohledňuje vzdálenost bodů. pro
>> programátory podrobnější info tady:
>> https://github.com/fordfrog/ruian2osm/blob/next_release/src/main/java/com/fordfrog/ruian2osm/AddressNodesMatcher.java
>>
>> tady je ještě údaj o průměrné vzdálenosti propojených bodů:
>> Average matched node distance: 0,0000046
>>
>> v příloze posílám (snad proleze zip) kompletní log z bota. uvítal bych,
>> pokud by se někdo na ten log podíval, jestli tam nenajde ještě něco
>> zajímavého (nějaké zjevné chyby, na co si dát pozor apod.). stejně tak,
>> pokud budete někdo chtít, abych pustil bota (samozřejmě pouze v testovacím
>> režimu) na nějaké vaší oblíbené oblasti, tak mi pošlete bounding box a já
>> vám pošlu log z bota.
>>
>> ff
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> http://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>




Další informace o konferenci talk-cz