[Talk-cz] Soubor cr.map pro import adres
Lukas Kabrt
lukas na kabrt.cz
Neděle Leden 24 09:14:30 UTC 2010
> vygeneroval jsem soubor cr.map [2] obsahující mapování pro program
> merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí
> některými zásadními nedostatky:
Diky, urcite to hodne pomuze.
> 1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno
> velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy
> nutné upravit názvy podle pravopisu.
S velikosti pismen v souboru *.map si neni potreba lamat hlavu. Nazvy
stejne beru z datatabaze MVCR a velikost pismen upravuju podobnym
algoritmem, jaky je pouzit v pluginu czechaddress. Proc? Protoze z
databaze se berou nazvy ulic a i ty jsou vsechny velkyma pismenema.
Tak jsem vzal z databaze vse. Vysledek sice v nekterych pripadech neni
podle pravidel ceskeho pravopisu, ale postupne na tom pracuju - kdyz
narazim na nejakou chybu, tak se ji snazim do algoritmu zakomponovat.
Mozna by stalo za uvahu, zda nazvy mest / mestskych casti nebrat ze
souboru *.map, kde je mozne velikost pismen upravit rucne.
> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
> databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy
> doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se
> jméno katastrálního území liší.
Klic by mohl byt tady [1], nevim ale jak je to s licenci. Je tam
prirazeni k.u. - obec, sice uz ne k.u. mestska cast, ale ve vetsine
pripadu se ty nazvy podobaji, takze by to mohlo jit odhadnout.
> 3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území
> navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím
> zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat.
Pisu si do TODO listu. Udelam to tak, ze program "zarve", ale nespadne.
Osobne to stejne delam tak, ze merge pouztim pouze na par k.u.
najednou, lip se tim pak pracuje v JOSM, je to prehlednejsi.
[1] http://www.cuzk.cz/Dokument.aspx?PRARESKOD=10&MENUID=10015&AKCE=DOC:10-CISE_KUAP
--
Lukas
Další informace o konferenci talk-cz