[Talk-cz] rúian bot - první výsledky testů

vrs na email.cz vrs na email.cz
Pondělí Srpen 6 15:04:39 UTC 2012


Mimochodem znáte plugin Conflation pro JOSM?

http://wiki.openstreetmap.org/wiki/JOSM/Plugins/Conflation

Nemám s tím zkušenosti (jsem tu nový), ale podle popisu to lze použít pro poloautomatický import a slučování dat z vnějších databází do OSM. Např. právě přiřazování adres z RÚIAN existujícím prvkům v OSM. Možná to není vhodné na plně automatický chod, ale třeba by to šlo použít na manuální dočišťování?

Jan


> ------------ Původní zpráva ------------
> Od: Jan Bilak <jan.bilak.osm na gmail.com>
> Předmět: Re: [Talk-cz] rúian bot - první výsledky testů
> Datum: 06.8.2012 16:04:59
> ----------------------------------------
> Ahoj,
> 
> jak ten bot rychlý? Aneb za jak dlouho by zpracoval (pokusně) celou ČR
> - tedy vygeneroval log?
> 
> Můžeš udělat histogram vzdáleností spárovaných bodů?
> 
> Honza
> 
> 
> Dne 6. srpna 2012 4:54 Mirek Dlask <dlask.m na gmail.com> napsal(a):
> > Je otázka, zda nejsou v RÚIAN adresní body domů bez č.p. , asi tam budou
> > adresní body rozestavěných domů. Ty v OSM předpokládám nejsou.
> > Nebo by se asi zobrazovaly tečky bez čísel!?
> >
> > Buď zkusit zmenšit boxík na nějaké garáže, nebo průmysl bez č.p. ,
> > nebo SELECT adresních bodů bez čísel popisných a zároveň evidenčních,
> > jsou-li ...
> >
> >
> >
> > 150 je fakt nějak moc
> >
> > Mirek
> >
> > Dne 5. srpna 2012 23:30 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):
> >>
> >> tak jsem dodělal bota do stádia, že načte body z osm api a z rúian db,
> >> pokusí se je spárovat a vygeneruje nějaké statistiky. pokud se někdo chce
> >> podívat do kódu, tak je k dispozici na https://github.com/fordfrog/ruian2osm
> >>
> >> co se týče načítání bodů z api, tak jsem to omezil na nody, které mají tag
> >> addr:housenumber a tag addr:country=CZ (doufám, že adresní body v čr mají
> >> aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).
> >>
> >> pro testy jsem použil BOX(14.63 50.55,14.68 50.58).
> >>
> >> pro párování bodů jsem nastavil maximální povolenou vzdálenost na 0.005,
> >> nicméně největší vzdálenost mezi shodnými body je 0,0009538 (RÚIAN:
> >> POINT(14.6562825 50.5617608) CZ, Doksy, Hálkova 890 OSM: POINT(14.6553375
> >> 50.5616313) CZ, null, Hálkova 890,
> >> http://maps.fordfrog.com/?zoom=18&lat=50.56166&lon=14.65557&layers=0B0FTF).
> >> u tohohle bodu je zajímavé, že údaj v kú je jiný než údaj v rúian (je to
> >> vidět z kú vrstvy, u nás ale zatím neproběhla digitalizace).
> >>
> >> co se týče propojování, tak úspěšnost byla následující:
> >> Total matched nodes: 1 136
> >> Total unmatched nodes - RÚIAN: 150, OSM: 15
> >>
> >> z toho mj vyplývá, že pokud jsem nikde neudělal chybu, tak v dané oblasti
> >> je oproti rúian navíc 15 adresních bodů a 150 jich chybí (což je opravdu
> >> dost na tak malé území, aspoň podle mě).
> >>
> >> k párování ještě poznámka. to že se body sprárovaly ještě neznamená, že
> >> osm obsahuje kompletní adresy. jak jsem psal jinde, u nás kompletně chybí
> >> addr:city, součástí adresy není ani addr:postcode. párování probíhá v
> >> několika cyklech, nejdříve podle celé adresy, nespárované body se pak
> >> porovnávají podle ulice a čísla, a to co zbyde se nakonec porovná pouze
> >> podle čísla. ve všech případech se ještě zohledňuje vzdálenost bodů. pro
> >> programátory podrobnější info tady:
> >>
> https://github.com/fordfrog/ruian2osm/blob/next_release/src/main/java/com/fordfrog/ruian2osm/AddressNodesMatcher.java
> >>
> >> tady je ještě údaj o průměrné vzdálenosti propojených bodů:
> >> Average matched node distance: 0,0000046
> >>
> >> v příloze posílám (snad proleze zip) kompletní log z bota. uvítal bych,
> >> pokud by se někdo na ten log podíval, jestli tam nenajde ještě něco
> >> zajímavého (nějaké zjevné chyby, na co si dát pozor apod.). stejně tak,
> >> pokud budete někdo chtít, abych pustil bota (samozřejmě pouze v testovacím
> >> režimu) na nějaké vaší oblíbené oblasti, tak mi pošlete bounding box a já
> >> vám pošlu log z bota.
> >>
> >> ff
> >>
> >> _______________________________________________
> >> Talk-cz mailing list
> >> Talk-cz na openstreetmap.org
> >> http://lists.openstreetmap.org/listinfo/talk-cz
> >>
> >
> >
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > http://lists.openstreetmap.org/listinfo/talk-cz
> >
> 
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
> 
> 
> 




Další informace o konferenci talk-cz