[Talk-cz] RFC: používání češtiny
Stanislav Brabec
utx na penguin.cz
Pátek Září 5 09:32:25 UTC 2008
hanoj píše v Pá 05. 09. 2008 v 09:20 +0200:
> > kostel svatého Václava. Zkratka se zpětně udělat dá automaticky, kdežto
> > obráceně je to těžké. Svatý je IMO označení toho, že byl svatořečen a
> > není to součástí jeho jména, neboť oficiálně to byl kníže Václav I.
> *** znovu jsem se nad tim zamyslel (a srovnaval jak to delaji jinde) a
> slovo kostel bych odstranil uplne a vyznam uvadel jen pokud bude jiny
> (kaple?, basilika, katedrala).
To sice dává smysl, vytváří to však oříšek pro vyhledávač:
sv. Marek
kaplička sv. Marka
Pokud někdo zadá do vyhledávače "sv. Marek" najde se jen jedno z toho.
Asi by to mělo smysl řešit globálně pro jazyky se skloňováním, buď
novými tagy, nebo inteligencí vyhledávače, který by uměl skloňovat
jména.
name=kaple sv. Marka
nominative=sv. Marek
Tady jsem se to pokusil nastínit, ale skoro si myslím, že by to byla
docela nepříjemná práce. Neexistuje někde kód, který by to již uměl a
dal by se zapracovat do vyhledávače? Pravidelně mi poštou chodí
automaticky generované dopisy nadepsané "Vážený pane Brabče", takže
rozhodně takový software existuje, a není úplně blbý.
Proposed tags:
nominative
genitive
Languages with inflexion can use a different form of the name in the
name, depending of form of writing. In case, that inflexion can block
the search engine, tags nominative or genitive can be used for alternate
forms of the name.
Both tags can use all forms, that use name tag, e. g.: nominative_old,
genitive:cs etc.
Examples:
chapel of st. Marc:
name=kaple sv. Marka
nominative=sv. Marek
church of st. Marc (omitting the "church" as it is the default):
name=sv. Marek
genitive=sv. Marka
--
Stanislav Brabec
http://www.penguin.cz/~utx
Další informace o konferenci talk-cz