[Talk-cz] rúian bot - první výsledky testů

Miroslav Šulc fordfrog na fordfrog.com
Pondělí Srpen 6 17:27:13 UTC 2012


v příloze posílám log z bota. tady pak ještě výtah z logy pro ty, kterým
se nebude chtít zip otevírat:

Loaded 1 632 OSM nodes
Loaded 2 044 RÚIAN nodes
Matching nodes by full address...
0 nodes matched
Matching nodes by street...
Matched RÚIAN node POINT(14.901064 50.4144003) CZ, 29301 Mladá Boleslav,
Ptácká 28/29 and OSM node POINT(14.9009875 50.4211801) CZ, null null,
Ptácká 28/29 but their distance 0,0067802 is over the limit 0,005
Matched RÚIAN node POINT(14.9009205 50.4145706) CZ, 29301 Mladá
Boleslav, Ptácká 295 and OSM node POINT(14.9001738 50.4229025) CZ, null
null, Ptácká 295 but their distance 0,0083653 is over the limit 0,005
Matched RÚIAN node POINT(14.9043758 50.4183866) CZ, 29301 Mladá
Boleslav, Folprechtova 1259 and OSM node POINT(14.9031463 50.4242688)
CZ, null null, Folprechtova 1259 but their distance 0,0060093 is over
the limit 0,005
1 398 nodes matched
Matching nodes by conscription/provisional number...
Matched RÚIAN node POINT(14.9063657 50.4280101) CZ, 29301 Mladá
Boleslav, U stadionu 983 and OSM node POINT(14.919441 50.4385282) CZ,
null null, Jižní 983 but their distance 0,0167808 is over the limit 0,005
Matched RÚIAN node POINT(14.901064 50.4144003) CZ, 29301 Mladá Boleslav,
Ptácká 28/29 and OSM node POINT(14.9009875 50.4211801) CZ, null null,
Ptácká 28/29 but their distance 0,0067802 is over the limit 0,005
Matched RÚIAN node POINT(14.9009205 50.4145706) CZ, 29301 Mladá
Boleslav, Ptácká 295 and OSM node POINT(14.9001738 50.4229025) CZ, null
null, Ptácká 295 but their distance 0,0083653 is over the limit 0,005
Matched RÚIAN node POINT(14.9059945 50.4299041) CZ, 29301 Mladá
Boleslav, Na Radouči 1078 and OSM node POINT(14.9109589 50.4126665) CZ,
null null, Třída T. G. Masaryka 1078 but their distance 0,0179382 is
over the limit 0,005
Matched RÚIAN node POINT(14.9043758 50.4183866) CZ, 29301 Mladá
Boleslav, Folprechtova 1259 and OSM node POINT(14.9031463 50.4242688)
CZ, null null, Folprechtova 1259 but their distance 0,0060093 is over
the limit 0,005
Matched RÚIAN node POINT(14.9091991 50.4195372) CZ, 29301 Mladá
Boleslav, Palackého 1396 and OSM node POINT(14.9130038 50.4308788) CZ,
null null, null 1396 but their distance 0,0119628 is over the limit 0,005
202 nodes matched
Total matched nodes: 1 600
Total unmatched nodes - RÚIAN: 444, OSM: 32
Maximum matched node distance: 0,0023727 (RÚIAN: POINT(14.9013315
50.422053) CZ, 29301 Mladá Boleslav, Pod skalou 303 OSM:
POINT(14.9006775 50.4243338) CZ, null null, Pod Skalou 303)

ff


Dne 6.8.2012 16:02, Mirek Dlask napsal(a):
> Test box na duplicity 14.9   50.44   ,    14.92    50.41
> Není to celá MB. 
>
> Kněžmost - místo kde č.p. nedostavají domy ale dvorky .-)
>
> http://maps.fordfrog.com/?zoom=18&lat=50.49012&lon=15.03952&layers=B00FFF 
>
>
>
> Dne 6. srpna 2012 15:27 Miroslav Šulc <fordfrog na fordfrog.com
> <mailto:fordfrog na fordfrog.com>> napsal(a):
>
>     Dne 6.8.2012 15:00, Mirek Dlask napsal(a):
>>
>>     A taky ti musíme držet palce ;-) při řešení duplicit adresních
>>     bodů :-(
>>     M. Boleslav, Debř ...............
>>     Docela by mě zajímal počet.
>
>     kdyžtak mi pošli boudning box pro oblast, kde je hodně duplicit, a
>     já na tom pustím bota a uvidíme, co z něj vyleze.
>
>>     Co s nima? Smazat ty vzdálenější, co nejdříve, respektive pře
>>     aktualizací?
>
>     no, jestli se nepletu, tak duplicity se vyfiltrují tím botem,
>     protože první bod se namapuje na odpovídající bod v rúian, a druhý
>     bod už nebude na co namapovat, takže zbyde a bot ho bude brát jako
>     nadbytečný a určený k odstranění.
>
>>     Už jsem jednou zmiňoval, že na některých adresních bodech jsou
>>     další tagy.
>>
>>     name, amenity, operator, 
>>     http://www.openstreetmap.org/browse/node/1767482902/history
>>
>>     Převést tagy na nové body, nebo budovy?
>>     Jinak co jsem našel, už jsem před časem opravoval.
>
>     taky jsem si toho všimnul. vzhledem k tomu, že bot u bodů, které
>     existují v rúian i v osm, provede aktualizaci bodu v osm, tak ke
>     ztrátě informací nedojde (upraví pouze adresní tagy + source).
>     jiná situace je u duplicit, tam je otázka, který bod si bot vybere
>     (aktuálně ten bližší k souřadnicím v rúian) a tam pak může dojít
>     ke ztrátě určitých tagů. asi by se to dalo nějak ošetřit, např že
>     by bot přidával větší váhu bodu, který má více tagů, ale to je
>     otázka, jestli by to nemělo negativní vliv na párování. na budovy
>     bych to asi (aspoň v tuhle chvíli) nepřeváděl, protože budov je v
>     osm nesrovnatelně méně než adresních bodů. osobně ani netuším, zda
>     je tohle tagování adresních bodů (amenity apod) ok nebo by se to
>     mělo dělat jinak.
>
>>     V budoucnu bude asi problém se jmény ulic
>>     http://tools.geofabrik.de/osmi/?view=addresses&lon=15.18443&lat=50.46818&zoom=18&opacity=0.97&overlays=buildings,buildings_with_addresses,postal_code,nodes_with_addresses_defined,nodes_with_addresses_interpolated,no_addr_street,street_not_found,interpolation,interpolation_errors,connection_lines,nearest_points,nearest_roads
>>
>>
>>     Tím tvým postupem se vlastně i aktualizuje název ulice u
>>     adresního bodu. Ulici na Václava Havla bude muset přejmenovat
>>     člobrda.
>
>     přesně tak, bot by měl zvládnout i přejmenování ulic na adresních
>     bodech (ale ne na ulicích). určitě by nebyl problém někam
>     reportovat změnu názvu ulice (adresy obecně), aby to pak někdo
>     mohl ručně zkontrolovat a zaktualizovat případně související
>     objekty (název ulice apod).
>
>>
>>     Mirek
>
>     ff
>
>>
>>     Dne 6. srpna 2012 12:29 Miroslav Šulc <fordfrog na fordfrog.com
>>     <mailto:fordfrog na fordfrog.com>> napsal(a):
>>
>>         Dne 6.8.2012 08:05, hanoj napsal(a):
>>         >> co se týče načítání bodů z api, tak jsem to omezil na
>>         nody, které mají tag
>>         >> addr:housenumber a tag addr:country=CZ (doufám, že adresní
>>         body v čr mají
>>         >> aspoň tyto tagy, pokud ne, tak bych to musel udělat jinak).
>>         > *** jakým způsobem budeme pracovat s OSM addr, které jsou
>>         vloženy v
>>         > polygonech budov(building=yes)? Převedeme tyto addr
>>         informace před
>>         > prací bota na z polygonu body (centroindy polygonů) ?
>>
>>         dobře že se o nich zmiňuješ, na ně jsem úplně zapomněl.
>>         upravím bota
>>         tak, aby načítal i adresy z budov. následně při aktualizaci
>>         by pak bot
>>         údaje o adrese z budovy mohl smazat a vytvořil by nový
>>         adresní bod.
>>
>>         >> pro testy jsem použil BOX(14.63 50.55,14.68 50.58).
>>         >>
>>         >> pro párování bodů jsem nastavil maximální povolenou
>>         vzdálenost na 0.005,
>>         > *** na prvni pohled mi neni zrejme co je cilem parovani,
>>         ale v k.u.
>>         > Tuřany, k.u. Chrlice je běžná vzdálenost bodů addr v OSM
>>         (import z
>>         > UIR-ADR) vůči WMS CUZK:KM 10 až 30 metrů,
>>
>>         cílem párování je zjistit, který bod z osm odpovídá kterému
>>         bodu z
>>         rúian. na základě toho pak může dojít ze strany bota k
>>         aktualizaci již
>>         existujícího bodu místo odstranění jednoho a vytvoření
>>         druhého, takže
>>         dojde k zachování historie. neumím přepočítávat vzdálenost ze
>>         stupňů na
>>         metry, ale odhadem ten limit 0.005 bude asi tak 500m. ono
>>         když bota
>>         pustím na malém území, tak tenhle parametr nehraje roli, ale
>>         když bych
>>         ho pustil na celé čr, tak se potřebuju vyhnout tomu, aby mi
>>         pároval mezi
>>         sebou body z opačných krajů republiky jako shodné (vzhledem k
>>         tomu, že u
>>         některých adresních bodů v osm chybí addr:city, tak je to
>>         možné). takhle
>>         bot spáruje jen body, které jsou v od sebe vzdálené maximálně
>>         500m. (v
>>         příkladu, který jsem uváděl v prvním mailu, je maximální
>>         vzdálenost dvou
>>         spárovaných bodů cca 100m.)
>>         > h.
>>         > hanoj
>>         ff
>>
>>         _______________________________________________
>>         Talk-cz mailing list
>>         Talk-cz na openstreetmap.org <mailto:Talk-cz na openstreetmap.org>
>>         http://lists.openstreetmap.org/listinfo/talk-cz
>>
>>
>>
>>
>>     _______________________________________________
>>     Talk-cz mailing list
>>     Talk-cz na openstreetmap.org <mailto:Talk-cz na openstreetmap.org>
>>     http://lists.openstreetmap.org/listinfo/talk-cz
>
>
>     _______________________________________________
>     Talk-cz mailing list
>     Talk-cz na openstreetmap.org <mailto:Talk-cz na openstreetmap.org>
>     http://lists.openstreetmap.org/listinfo/talk-cz
>
>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz

------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120806/a455ea29/attachment.html>
------------- další část ---------------
A non-text attachment was scrubbed...
Name: ruian-bot-mb.zip
Type: application/zip
Size: 51243 bytes
Desc: [žádný popis není k dispozici]
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120806/a455ea29/attachment.zip>
------------- další část ---------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 4475 bytes
Desc: Elektronicky podpis S/MIME
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20120806/a455ea29/attachment.bin>


Další informace o konferenci talk-cz