[Talk-cz] rúian bot - první výsledky testů

Miroslav Šulc fordfrog na fordfrog.com
Neděle Srpen 5 21:30:11 UTC 2012


tak jsem dodělal bota do stádia, že načte body z osm api a z rúian db,
pokusí se je spárovat a vygeneruje nějaké statistiky. pokud se někdo
chce podívat do kódu, tak je k dispozici na
https://github.com/fordfrog/ruian2osm

co se týče načítání bodů z api, tak jsem to omezil na nody, které mají
tag addr:housenumber a tag addr:country=CZ (doufám, že adresní body v čr
mají aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).

pro testy jsem použil BOX(14.63 50.55,14.68 50.58).

pro párování bodů jsem nastavil maximální povolenou vzdálenost na 0.005,
nicméně největší vzdálenost mezi shodnými body je 0,0009538 (RÚIAN:
POINT(14.6562825 50.5617608) CZ, Doksy, Hálkova 890 OSM:
POINT(14.6553375 50.5616313) CZ, null, Hálkova 890,
http://maps.fordfrog.com/?zoom=18&lat=50.56166&lon=14.65557&layers=0B0FTF).
u tohohle bodu je zajímavé, že údaj v kú je jiný než údaj v rúian (je to
vidět z kú vrstvy, u nás ale zatím neproběhla digitalizace).

co se týče propojování, tak úspěšnost byla následující:
Total matched nodes: 1 136
Total unmatched nodes - RÚIAN: 150, OSM: 15

z toho mj vyplývá, že pokud jsem nikde neudělal chybu, tak v dané
oblasti je oproti rúian navíc 15 adresních bodů a 150 jich chybí (což je
opravdu dost na tak malé území, aspoň podle mě).

k párování ještě poznámka. to že se body sprárovaly ještě neznamená, že
osm obsahuje kompletní adresy. jak jsem psal jinde, u nás kompletně
chybí addr:city, součástí adresy není ani addr:postcode. párování
probíhá v několika cyklech, nejdříve podle celé adresy, nespárované body
se pak porovnávají podle ulice a čísla, a to co zbyde se nakonec porovná
pouze podle čísla. ve všech případech se ještě zohledňuje vzdálenost
bodů. pro programátory podrobnější info tady:
https://github.com/fordfrog/ruian2osm/blob/next_release/src/main/java/com/fordfrog/ruian2osm/AddressNodesMatcher.java

tady je ještě údaj o průměrné vzdálenosti propojených bodů:
Average matched node distance: 0,0000046

v příloze posílám (snad proleze zip) kompletní log z bota. uvítal bych,
pokud by se někdo na ten log podíval, jestli tam nenajde ještě něco
zajímavého (nějaké zjevné chyby, na co si dát pozor apod.). stejně tak,
pokud budete někdo chtít, abych pustil bota (samozřejmě pouze v
testovacím režimu) na nějaké vaší oblíbené oblasti, tak mi pošlete
bounding box a já vám pošlu log z bota.

ff
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120805/085c5fb2/attachment.html>
------------- další část ---------------
A non-text attachment was scrubbed...
Name: ruian-bot.zip
Type: application/zip
Size: 30341 bytes
Desc: [žádný popis není k dispozici]
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120805/085c5fb2/attachment.zip>
------------- další část ---------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 4475 bytes
Desc: Elektronicky podpis S/MIME
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120805/085c5fb2/attachment.bin>


Další informace o konferenci talk-cz