[Talk-cz] Import adres z katastralni mapy

Lukas Kabrt lukas na kabrt.cz
Sobota Leden 23 19:40:13 UTC 2010


> V kroku 3 (vytvoreni XML souboru, ktery definuje prirazeni mezi
> katastralnim uzemim a obci / casti obce z databaze adresnich bodu)
> jsem převzal XML z dokumentace. A k tomu se váže první dotaz. Kde
> berete tyto informace? A k čemu je to dobré? Upozorňuji, že nejsem
> zaměměřič, ale programátor, takže o struktuře území toho moc nevím, i
> když jsem k této oblasti trochu přičichnul.

> Moje představa je, že čísla domů jsou jedinečná v části obce (proto
> např. v nahlížení do KN říkám obec, část obce, číslo budovy). Proto je
> třeba nějak určit část obce, do které dané území patří.

Presne tak.

> číselníky částí obcí a jejich vztahy k obcím, okresům, krajům apod.
> jsou na Českém Statistikém Úřadě. Ale nevím, zda je lze z licenčních
> důvodů použít (ví to někdo?). Ruční vytváření XML pro každé
> katastrální území, kterých jsou tisíce(?) je poněkud nepraktické a
> hlavně hrozí chyby.

Ano je to trochu neprakticke. Asi by to slo castecne automatizovat.
Muj postup je, ze si z databaze [1] vytahnu stukturu oblast - obec -
cast a z mapy nazvy k. u. a rucne prirazuju, vestinou je to jasne
(zatim stejne delam v mistech, ktere jakz takz znam). Prirazeni k.u. -
obec lze nalezt na strankach CUZK [2]. Jak je to s licenci nevim.
Problemy jsou ale s nekterymi castmi obci - na jednom k.u. muze byt
vice casti obce.

>kterých jsou tisíce(?)

Presne 13027.

> A pak je třeba udělat merge. Odkud pochází databáze adres? To je
> UIR-ADR? Z jakého původního zdroje pocházejí hranice katastrálních
> území?

Adresy pochazeni z webu MVCR [1], hranice k.u. ktere mam na strankach
jsou vektorizovane mapy CUZK - vektorizaci delal hanoj [3], a Martin
Kupec pracuje na OCR nazvu k.u., vysledek na mych strankach jeste neni
hotovy, chybi jeste cca 800 nazvu.

> A co vlastně merge dělá? Moje představa je, že pro každý adresní bod z
> toho CSV souboru vygenerovaném v jednom z předchozích kroků najde
> katastrální území, jehož hranice je v souboru daném parametrem
> territories.

Merge vezme CSV soubor se souradnicemi budov a rozpoznanym popiskem,
najde k.u., ve kterem se budova nachazi, podiva se do souboru *.map
jaka obec, mestska cast se na k.u. nachazi a podle toho se budove
pokusi priradit adresu z databaze MVCR.

> U druhého parametru nevím. Zkoušel jsem
> http://osm.templ.net/kucr.osm.bz2

ten urcite fungovat nebude, tam nejsou nazvy k.u.

> http://lkabrt.aspone.cz/osm/kucr.zip.

ten muzes pouzit, ale je potreba zkotrolovat, jestli tam je zadany to
k.u. o ktery se zajimas - nazvy jeste nejsou kompletni.


> Čtvrtý parametr - to je to XML převzaté pro pokus z dokumentace.

priklad z dokumentace mozna nebude kompatiblni s mapu z
http://lkabrt.aspone.cz/osm/kucr.zip. Koukam, ze je to jeste z doby,
kdy jsem mapu zkousel malovat jen tak priblizne rucne, jen pro ucely
tohohle programu takze asi nesedi nazvy.

> 2) V případě použití http://lkabrt.aspone.cz/osm/kucr.zip program
> vytíží jedno jádro procesoru a nic ... tedy nechal jsem to pár desítek
> minut (nebo mám čekat déle?). Poslední hláška je, že Loading
> territories borders...

Pro parsovani XML pouzivam XML.LINQ, a ten neni delany na zpracovani
tak velkych souboru, proto si ze souboru kucr.zip vyriznu cast se
kterou chci pracovat [4]. S parsovanim XML dokumentu mozna neco
udelam, fakt to neni nejrychlejsi. XML.Linq ma ale tu vyhodu, ze se s
tim hezky pracuje, takze jsem ho pouzil pri vyvoji.

> Další věc je, že ten XML soubor z kroku 2 definuje vztahy pomocí
> názvů. Ale ty myslím nejsou jednoznačné. Přitom číselníky katastru i
> Stat. úřadu používají pro označení obce, části obce, katastr. území
> apod. také nějaká číselná IDčka (kupodivu dokonce stejná).

Jmena k.u. jsou jedinecna, stejne tak kombinace oblast-obec-cast z databaze.

[1] http://aplikace.mvcr.cz/adresa/adresy.zip
[2] http://www.cuzk.cz/Dokument.aspx?PRARESKOD=10&MENUID=10015&AKCE=DOC:10-CISE_KUAP
[3] http://lists.openstreetmap.org/pipermail/talk-cz/2009-June/003204.html
[4] http://lists.openstreetmap.org/pipermail/talk-cz/2010-January/004310.html
--
Lukas




Další informace o konferenci talk-cz