[Talk-cz] Import adres z katastralni mapy
Lukas Kabrt
lukas na kabrt.cz
Pondělí Únor 15 08:44:58 UTC 2010
Ahoj,
ja byl ted tyden pryc, proto jsem se do diskuze a reseni problemu nezapojil.
Pokud spravne chapu situaci, tak problem je u c.e., ve kterych je
cislice 2 se obcas stava a obcas se stava, ze se rozpozna jako 7. Jak
jsem z diskuze pochopil, tak Honza Bilak napsal programek, ktery vezme
celou dlazdici a provede OCR jinym zpusobem.
Ja mam pripravene skripty na docisteni vysledku (slouceni dat z
dlazdic, vymazani duplicit zpusobenych prekryvem dlazdic, vyfiltorvani
bodu ktere neodpovidaji vzoru c.p., c.e., bez cp./c.e a jejich stazeni
ve vyssim rozliseni a znovuprovedeni OCR - vyreseni prokryvajicich se
napisu)
Vysledky po stazeni detailu a znovuprovedeni OCR jsou celkem dobre. Na
datech, co byla spocitana minuly tyden (cca 2/3 republiky) je po
znovuprovedeni OCR jen 1050 adresnich bodu, ktere neodpovidaji
zadanemu vzoru.
Myslim, ze by bylo zbytecne zpracovavat celou CR znovu. Z dat si muzu
vytahnout c.e., ktera obsahuji cislici 7, stahnout si detail ve vyssim
rozliceni a ten misto terreractem zpracovat algoritmem od Honzy.
--
Lukas
Další informace o konferenci talk-cz