[Talk-cz] Import adres z katastralni mapy

Petr Dlouhý petr.dlouhy na email.cz
Středa Leden 27 11:31:14 UTC 2010


Dovolil bych si ještě jednu poznámku. Program si ukládá pomocné soubory do  
aktuálního adresáře s konstantním jménem (pokud se od minulé verze nic  
nezměnilo). Jestli tomu dobře rozumím, tak nemohu spustit víc instancí  
těch skriptů v jednom adresáři bez toho, aby se nepopraly (budou si  
OCRkovat čísla navzájem).
Je to tak? Pokud ano, tak by to chtělo uživatele důrazně varovat, protože  
by se mohlo stát, že výsledek bude pomíchaný a nikdo si toho nevšimne.  
Nešlo by s tím něco udělat?

On Tue, 26 Jan 2010 20:10:09 +0100, Lukas Kabrt <lukas na kabrt.cz> wrote:

> Provedl jsem par zmen v programu tile-processor, binarky [1] i
> zdrojove kody [2] muzete stahovat z mych stranek.
>
> Hlavni zmeny:
> rychlost - OCR utitlita se ted spousti pouze jednou pro kazdou
> dlazdici - prineslo to cca dvojnasobnou rychlost zpracovani
> drobne zvyseni presnosti - presnejsi orez popisku a vynechani budov
> blizko praveho okraje (tak jak navrhoval Petr Dlouhy)
> pridano logovani cinnosti
> osetreni chyb - program by se ted mel byt schopny zotavit z vetsiny
> chyb, pouze zaloguje co se stalo a pokracuje v cinnosti
>
> V binarkach jsou dve verze tile processoru - jedna pro LINUX s upravou
> od Petra Dlouheho ([3], bod 2), druha bez ni. Nechal jsem dve verze,
> protoze u me verze s upravou dava o neco horsi vysledky pri OCR (cca o
> 1 - 2% vice chyb)
>
> Progam jsem zkousel na platforme Win/.NET a Win/MONO a funguji bez
> problemu. Nekoho bych poprosil aby vyzkousel jestli neni nejaky
> problem na Linuxu.
>
>
> Distribuovane pocitani
> Diky vsem, kteri se ozvali a nabidli se, ze pomuzou s vypoctem.
>
> Rozdelil jsem CR na dlazdice 0.2 x 0.2 stupne, celkem je to 302
> dlazdic. Hranice jsou definovany v CSV souboru [4], prilozena je i
> prehledova mapka. Zpracovani jedne dlazdice by se melo vejit do 1
> hodiny.
>
> CSV soubor ma nasledujici format
> ID,sever,vychod,jih,zapad
>
> Pro koordinaci jsem na wiki zalozil stranku [5]. Pokud se rozhodnete
> pomoct, zapiste na wiki, jake dlazdice zpracujete - at se neco
> nepocita vicekrat. Dlazdice prosim vybirejte postupne, at v tom neni
> zmatek.
>
> Moje idea dalsiho postupu je takova, ze vysledky vypoctu (CSV a LOG
> soubory) zpracuju, pripadne opravim data na mistech, kde se vyskytnul
> nejaky error a vysledek umistim nekde na web k dalsimu vyuziti pro
> import adres.
>
> Postup
> 1) na wiki napsat dlazdice, ktere se chystam zpracovat
> 2) ze souboru [4] zjistit hranice dlazdic
> 3) stahnout data z WMS CUZK
>
> tile-downloader.exe -north [sever] -west [zapad] -south [jih] -east
> [vychos] -addressPoints -output [ID-Dlazdice]
>
> 4) zpracovat dlazdici
>
> tile-processor.exe -tiles [ID-Dlazdice] - output [ID-Dlazdice].csv
>
> 5) zabalit vytvorene soubory (CSV a LOG) a vysledek nekam uplodovat
> nebo zaslat na mail osm na kabrt.cz
>
> [1] http://lkabrt.aspone.cz/osm/cuzk.zip
> [2] http://lkabrt.aspone.cz/osm/cuzk-source.zip
> [3]  
> http://lists.openstreetmap.org/pipermail/talk-cz/2010-January/004312.html
> [4] http://lkabrt.aspone.cz/osm/oblasti.zip
> [5] http://wiki.openstreetmap.org/wiki/Import_Adres_ČR/Prubeh_Zpracovani
> --
> Lukas
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz


-- 
Petr Dlouhý




Další informace o konferenci talk-cz