[Talk-cz] rúian bot - první výsledky testů

Libor Pechacek lpechacek na gmx.com
Úterý Srpen 7 19:53:54 UTC 2012


Ahoj,

On Mon 06-08-12 17:04:39, vrs na email.cz wrote:
> Mimochodem znáte plugin Conflation pro JOSM?
> 
> http://wiki.openstreetmap.org/wiki/JOSM/Plugins/Conflation
> 
> Nemám s tím zkušenosti (jsem tu nový), ale podle popisu to lze použít pro
> poloautomatický import a slučování dat z vnějších databází do OSM. Např.
> právě přiřazování adres z RÚIAN existujícím prvkům v OSM. Možná to není
> vhodné na plně automatický chod, ale třeba by to šlo použít na manuální
> dočišťování?

Věnoval jsem zatím zkoumání tohoto nástroje přibližně půl hodiny a přijde mi
použitelný.  Nicméně, je to mocný nástroj a jako takový je třeba jej používat s
rozumem.  Na dočišťování asi bude vhodný.

Libor

> Jan
> 
> 
> > ------------ Původní zpráva ------------
> > Od: Jan Bilak <jan.bilak.osm na gmail.com>
> > Předmět: Re: [Talk-cz] rúian bot - první výsledky testů
> > Datum: 06.8.2012 16:04:59
> > ----------------------------------------
> > Ahoj,
> > 
> > jak ten bot rychlý? Aneb za jak dlouho by zpracoval (pokusně) celou ČR
> > - tedy vygeneroval log?
> > 
> > Můžeš udělat histogram vzdáleností spárovaných bodů?
> > 
> > Honza
> > 
> > 
> > Dne 6. srpna 2012 4:54 Mirek Dlask <dlask.m na gmail.com> napsal(a):
> > > Je otázka, zda nejsou v RÚIAN adresní body domů bez č.p. , asi tam budou
> > > adresní body rozestavěných domů. Ty v OSM předpokládám nejsou.
> > > Nebo by se asi zobrazovaly tečky bez čísel!?
> > >
> > > Buď zkusit zmenšit boxík na nějaké garáže, nebo průmysl bez č.p. ,
> > > nebo SELECT adresních bodů bez čísel popisných a zároveň evidenčních,
> > > jsou-li ...
> > >
> > >
> > >
> > > 150 je fakt nějak moc
> > >
> > > Mirek
> > >
> > > Dne 5. srpna 2012 23:30 Miroslav Šulc <fordfrog na fordfrog.com> napsal(a):
> > >>
> > >> tak jsem dodělal bota do stádia, že načte body z osm api a z rúian db,
> > >> pokusí se je spárovat a vygeneruje nějaké statistiky. pokud se někdo chce
> > >> podívat do kódu, tak je k dispozici na https://github.com/fordfrog/ruian2osm
> > >>
> > >> co se týče načítání bodů z api, tak jsem to omezil na nody, které mají tag
> > >> addr:housenumber a tag addr:country=CZ (doufám, že adresní body v čr mají
> > >> aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).
> > >>
> > >> pro testy jsem použil BOX(14.63 50.55,14.68 50.58).
> > >>
> > >> pro párování bodů jsem nastavil maximální povolenou vzdálenost na 0.005,
> > >> nicméně největší vzdálenost mezi shodnými body je 0,0009538 (RÚIAN:
> > >> POINT(14.6562825 50.5617608) CZ, Doksy, Hálkova 890 OSM: POINT(14.6553375
> > >> 50.5616313) CZ, null, Hálkova 890,
> > >> http://maps.fordfrog.com/?zoom=18&lat=50.56166&lon=14.65557&layers=0B0FTF).
> > >> u tohohle bodu je zajímavé, že údaj v kú je jiný než údaj v rúian (je to
> > >> vidět z kú vrstvy, u nás ale zatím neproběhla digitalizace).
> > >>
> > >> co se týče propojování, tak úspěšnost byla následující:
> > >> Total matched nodes: 1 136
> > >> Total unmatched nodes - RÚIAN: 150, OSM: 15
> > >>
> > >> z toho mj vyplývá, že pokud jsem nikde neudělal chybu, tak v dané oblasti
> > >> je oproti rúian navíc 15 adresních bodů a 150 jich chybí (což je opravdu
> > >> dost na tak malé území, aspoň podle mě).
> > >>
> > >> k párování ještě poznámka. to že se body sprárovaly ještě neznamená, že
> > >> osm obsahuje kompletní adresy. jak jsem psal jinde, u nás kompletně chybí
> > >> addr:city, součástí adresy není ani addr:postcode. párování probíhá v
> > >> několika cyklech, nejdříve podle celé adresy, nespárované body se pak
> > >> porovnávají podle ulice a čísla, a to co zbyde se nakonec porovná pouze
> > >> podle čísla. ve všech případech se ještě zohledňuje vzdálenost bodů. pro
> > >> programátory podrobnější info tady:
> > >>
> > https://github.com/fordfrog/ruian2osm/blob/next_release/src/main/java/com/fordfrog/ruian2osm/AddressNodesMatcher.java
> > >>
> > >> tady je ještě údaj o průměrné vzdálenosti propojených bodů:
> > >> Average matched node distance: 0,0000046
> > >>
> > >> v příloze posílám (snad proleze zip) kompletní log z bota. uvítal bych,
> > >> pokud by se někdo na ten log podíval, jestli tam nenajde ještě něco
> > >> zajímavého (nějaké zjevné chyby, na co si dát pozor apod.). stejně tak,
> > >> pokud budete někdo chtít, abych pustil bota (samozřejmě pouze v testovacím
> > >> režimu) na nějaké vaší oblíbené oblasti, tak mi pošlete bounding box a já
> > >> vám pošlu log z bota.
> > >>
> > >> ff
> > >>
> > >> _______________________________________________
> > >> Talk-cz mailing list
> > >> Talk-cz na openstreetmap.org
> > >> http://lists.openstreetmap.org/listinfo/talk-cz
> > >>
> > >
> > >
> > > _______________________________________________
> > > Talk-cz mailing list
> > > Talk-cz na openstreetmap.org
> > > http://lists.openstreetmap.org/listinfo/talk-cz
> > >
> > 
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > http://lists.openstreetmap.org/listinfo/talk-cz
> > 
> > 
> > 
> 
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz

-- 




Další informace o konferenci talk-cz