[Talk-cz] RFC: používání češtiny

Pavel Machek pavel na suse.cz
Pátek Září 5 10:35:09 UTC 2008


Ahoj!

> > > kostel svatého Václava. Zkratka se zpětně udělat dá automaticky, kdežto
> > > obráceně je to těžké. Svatý je IMO označení toho, že byl svatořečen a
> > > není to součástí jeho jména, neboť oficiálně to byl kníže Václav I.
> > *** znovu jsem se nad tim zamyslel (a srovnaval jak to delaji jinde) a
> > slovo kostel bych odstranil uplne a vyznam uvadel jen pokud bude jiny
> > (kaple?, basilika, katedrala).
> 
> To sice dává smysl, vytváří to však oříšek pro vyhledávač:
> sv. Marek
> kaplička sv. Marka
> 
> Pokud někdo zadá do vyhledávače "sv. Marek" najde se jen jedno z toho.
> 
> Asi by to mělo smysl řešit globálně pro jazyky se skloňováním, buď
> novými tagy, nebo inteligencí vyhledávače, který by uměl skloňovat
> jména.
> 
> ???name=kaple sv. Marka
> nominative=???sv. Marek
> 
> 
> Tady jsem se to pokusil nastínit, ale skoro si myslím, že by to byla
> docela nepříjemná práce. Neexistuje někde kód, který by to již uměl
> > > a

Hodne neprijemna.

> dal by se zapracovat do vyhledávače? Pravidelně mi poštou chodí
> automaticky generované dopisy nadepsané "Vážený pane Brabče", takže
> rozhodně takový software existuje, a není úplně blbý.

Tenhle kod existuje, jmenuje se morfologie, a ceska verse (GPL) je
treba na nltools.sf.net.

> Proposed tags:
> 
> nominative
> genitive

Nene, tohle at opravdu dela vyhledavac.

-- 
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html




Další informace o konferenci talk-cz