[Talk-cz] RFC: používání češtiny

Stanislav Brabec utx na penguin.cz
Pátek Září 5 09:32:25 UTC 2008


hanoj píše v Pá 05. 09. 2008 v 09:20 +0200:

> > kostel svatého Václava. Zkratka se zpětně udělat dá automaticky, kdežto
> > obráceně je to těžké. Svatý je IMO označení toho, že byl svatořečen a
> > není to součástí jeho jména, neboť oficiálně to byl kníže Václav I.
> *** znovu jsem se nad tim zamyslel (a srovnaval jak to delaji jinde) a
> slovo kostel bych odstranil uplne a vyznam uvadel jen pokud bude jiny
> (kaple?, basilika, katedrala).

To sice dává smysl, vytváří to však oříšek pro vyhledávač:
sv. Marek
kaplička sv. Marka

Pokud někdo zadá do vyhledávače "sv. Marek" najde se jen jedno z toho.

Asi by to mělo smysl řešit globálně pro jazyky se skloňováním, buď
novými tagy, nebo inteligencí vyhledávače, který by uměl skloňovat
jména.

name=kaple sv. Marka
nominative=sv. Marek


Tady jsem se to pokusil nastínit, ale skoro si myslím, že by to byla
docela nepříjemná práce. Neexistuje někde kód, který by to již uměl a
dal by se zapracovat do vyhledávače? Pravidelně mi poštou chodí
automaticky generované dopisy nadepsané "Vážený pane Brabče", takže
rozhodně takový software existuje, a není úplně blbý.



Proposed tags:

nominative
genitive

Languages with inflexion can use a different form of the name in the
name, depending of form of writing. In case, that inflexion can block
the search engine, tags nominative or genitive can be used for alternate
forms of the name.

Both tags can use all forms, that use name tag, e. g.: nominative_old,
genitive:cs etc.

Examples:

chapel of st. Marc:
name=kaple sv. Marka
nominative=sv. Marek

church of st. Marc (omitting the "church" as it is the default):
name=sv. Marek
genitive=sv. Marka

-- 
Stanislav Brabec
http://www.penguin.cz/~utx





Další informace o konferenci talk-cz