[Talk-cz] RFC: používání češtiny
Pavel Machek
pavel na suse.cz
Pátek Září 5 10:35:09 UTC 2008
Ahoj!
> > > kostel svatého Václava. Zkratka se zpětně udělat dá automaticky, kdežto
> > > obráceně je to těžké. Svatý je IMO označení toho, že byl svatořečen a
> > > není to součástí jeho jména, neboť oficiálně to byl kníže Václav I.
> > *** znovu jsem se nad tim zamyslel (a srovnaval jak to delaji jinde) a
> > slovo kostel bych odstranil uplne a vyznam uvadel jen pokud bude jiny
> > (kaple?, basilika, katedrala).
>
> To sice dává smysl, vytváří to však oříšek pro vyhledávač:
> sv. Marek
> kaplička sv. Marka
>
> Pokud někdo zadá do vyhledávače "sv. Marek" najde se jen jedno z toho.
>
> Asi by to mělo smysl řešit globálně pro jazyky se skloňováním, buď
> novými tagy, nebo inteligencí vyhledávače, který by uměl skloňovat
> jména.
>
> ???name=kaple sv. Marka
> nominative=???sv. Marek
>
>
> Tady jsem se to pokusil nastínit, ale skoro si myslím, že by to byla
> docela nepříjemná práce. Neexistuje někde kód, který by to již uměl
> > > a
Hodne neprijemna.
> dal by se zapracovat do vyhledávače? Pravidelně mi poštou chodí
> automaticky generované dopisy nadepsané "Vážený pane Brabče", takže
> rozhodně takový software existuje, a není úplně blbý.
Tenhle kod existuje, jmenuje se morfologie, a ceska verse (GPL) je
treba na nltools.sf.net.
> Proposed tags:
>
> nominative
> genitive
Nene, tohle at opravdu dela vyhledavac.
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Další informace o konferenci talk-cz