[Talk-cz] Import adres z katastralni mapy

Petr Dlouhý petr.dlouhy na email.cz
Sobota Únor 13 00:28:42 UTC 2010


Aha, tak to jsem předtím nepochopil. V tom případě se ale u některých "bez  
č.p./č.e." detekují nějaké mezery nebo jiný bordel za nimi a možná jsem  
viděl i případ, kdy se nějaké číslo prodloužilo o číslice, které tam  
neměly být (pokusím se to najít).

Dlaždice je na [1], je tam víc takových bodů, co se nedetekovali.  
Testovací data se pokusím nahrát, je toho kolem 200MB.

[1]  
http://www.flyshare.cz/stahni/46186/14.3362_50.1291_14.3412_50.1341-budovy.png

On Sat, 13 Feb 2010 01:10:29 +0100, Jan Bilak <jan.bilak.osm na gmail.com>  
wrote:

> Ořez by mohl být nižší, ale já to každý sloupec reprezentuji
> 16-bitovým číslem (16 řádek) a pak s tím dělám různé bitové operace.
> Takže 15 by se mi nehodilo...
> Tyhle nápady jsou dobré, ale nejsou třeba. Algoritmus totiž funguje
> tak, že se snaží najít napřed přesnou shodu. A pokud přesná shoda
> není, tak najít všechny možnosti, které tam mohou být. Pokud je více
> možností, co by tam mohlo být, tak to do textu přidá ?. Pokud jedna
> možnost, tak ji to bere jako správnou. A pokud žádá možnost, tak to
> končí. Check je jen indikace toho, že tam nebyla přesná shoda. Otazník
> je indikace toho, že to bylo mnohoznačné. Zatím tam tedy chybí jedna
> kontrola, která teoreticky může způsobit chybu bez otázníku (jen s
> checkem). Ale to opravím a pravděpodobnost takové chyby je velmi malá.
> Testovací data by se mi hodila, pokud máš kam dát nějaký archiv
> (klidně na nějaký free one-file hosting typu rapidshare - ale účet tam
> nikde nemám, tak aby to bylo reálné stáhnout zdarma).
> Honza


-- 
Petr Dlouhý




Další informace o konferenci talk-cz