[Talk-cz] Import adres z katastralni mapy

Jan Bilak jan.bilak.osm na gmail.com
Neděle Leden 24 11:18:04 UTC 2010


Tady je .NETí wrapper nad DLL. Ale píší tam, že Tesseract má memory
leaky, takže to čas o času spadne. Ale nějaké dávky (více popisků
najednou) by to mohlo zvládnout.

http://www.pixel-technology.com/freeware/tessnet2/

Honza


2010/1/24 Jan Bilak <jan.bilak.osm na gmail.com>:
> Já myslím, že hodně času žere spouštění nového procesu pro OCR. Pokud
> lze OCRu předhodit obrázek, který bude obsahovat více textů (a pak
> rozpoznat, co je co), nebo mu předhodit více obrázků (vícestránkový
> dokument), tak by to mohlo jít rychleji. Přecijen OCRka se běžně
> použivají na čtení hustého textu na A4 a s rozpoznání trvá chvilku.
>
> Honza
>
>
> Dne 24. ledna 2010 10:53 Lukas Kabrt <lukas na kabrt.cz> napsal(a):
>>> Pardon, myslel jsem dní.
>>>
>>> On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý <petr.dlouhy na email.cz>
>>> wrote:
>>>
>>>> (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi).
>>
>> Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
>> pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
>> to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
>> Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
>> pres 5 hodin. Muj pocitac pritom neni zadne "delo" - Intel Core2 Duo @
>> 2Ghz.
>>
>> --
>> Lukas
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> http://lists.openstreetmap.org/listinfo/talk-cz
>>
>




Další informace o konferenci talk-cz