[Talk-cz] Import adres z katastralni mapy
Petr Dlouhý
petr.dlouhy na email.cz
Sobota Únor 13 00:28:42 UTC 2010
Aha, tak to jsem předtím nepochopil. V tom případě se ale u některých "bez
č.p./č.e." detekují nějaké mezery nebo jiný bordel za nimi a možná jsem
viděl i případ, kdy se nějaké číslo prodloužilo o číslice, které tam
neměly být (pokusím se to najít).
Dlaždice je na [1], je tam víc takových bodů, co se nedetekovali.
Testovací data se pokusím nahrát, je toho kolem 200MB.
[1]
http://www.flyshare.cz/stahni/46186/14.3362_50.1291_14.3412_50.1341-budovy.png
On Sat, 13 Feb 2010 01:10:29 +0100, Jan Bilak <jan.bilak.osm na gmail.com>
wrote:
> Ořez by mohl být nižší, ale já to každý sloupec reprezentuji
> 16-bitovým číslem (16 řádek) a pak s tím dělám různé bitové operace.
> Takže 15 by se mi nehodilo...
> Tyhle nápady jsou dobré, ale nejsou třeba. Algoritmus totiž funguje
> tak, že se snaží najít napřed přesnou shodu. A pokud přesná shoda
> není, tak najít všechny možnosti, které tam mohou být. Pokud je více
> možností, co by tam mohlo být, tak to do textu přidá ?. Pokud jedna
> možnost, tak ji to bere jako správnou. A pokud žádá možnost, tak to
> končí. Check je jen indikace toho, že tam nebyla přesná shoda. Otazník
> je indikace toho, že to bylo mnohoznačné. Zatím tam tedy chybí jedna
> kontrola, která teoreticky může způsobit chybu bez otázníku (jen s
> checkem). Ale to opravím a pravděpodobnost takové chyby je velmi malá.
> Testovací data by se mi hodila, pokud máš kam dát nějaký archiv
> (klidně na nějaký free one-file hosting typu rapidshare - ale účet tam
> nikde nemám, tak aby to bylo reálné stáhnout zdarma).
> Honza
--
Petr Dlouhý
Další informace o konferenci talk-cz