[Talk-cz] Nedělitelná mezera v OSM datech

Jan Martinec jan na martinec.name
Pátek Leden 20 12:43:07 UTC 2017


On 01/20/17 13:18, Lukáš Karas wrote:
> Ano, lidé na to budou zapmínat a dělat chyby. Stejně jako nyní se může stát že
> někdo napíše název bez diakritiky.
>
> Jak chceš indickému nebo čínskému vývojáři vysvětlit že by měl do svého
> rendereru integrovat processor pro vkládání pevných mezer do českých názvů?
> Jak chceš v rendereru detekovat že se jedná o češtinu?
Tak. Ano, můžeš teoreticky porovnávat name:* a name, a z toho hádat - 
ale vyčteš z toho jedině "toto je asi místní jazyk, tak na 80%" (pokud 
ti to nějaký tatar s Maps.me nepřepíše u Karlova mostu na name:cs=Károly 
Híd :D) - a zbylých dvacet procent bude chyba I.typu: "name=Москва, co 
je další v atributech? Aha, name:ab=Москва, takže máme jasno, použijme 
pravidla pro abcházštinu, další tagy už zkoumat netřeba."

Renderer by neměl být repozitář jazykových konvencí (a fakt pochybuju, 
že i Mapnik má nějakou takovou heuristiku), jen by měl respektovat 
hinty, kterými jsou právě ty konvence vyznačený - a jeden z těch hintů 
je "tady nelámat".
>
> Jediné o co by renderer měl starat je respektovat unicode pravidla -
> vykreslovat názvy správně v hebrejštině (psaná zprava) i v latince, či
> kombinaci obého (i když jsem takové názvy v OSM ještě neviděl) zalamovat
> dlouhé názvy jen tam kde je to možné...
A to je náhoda - v Missing Maps se zrovna mapuje
http://tasks.hotosm.org/project/2419 v Jižním Súdánu. Město se údajně, 
aspoň podle OSM name, jmenuje "Aweil أويل" (fskutčnosti name:en+ar)
http://www.openstreetmap.org/node/234617069#map=14/8.7555/27.3998
(Korejci to mají podobně, ale ti aspoň nemají RTL)

Neboli: NBSP zejména _centrální_ řešení. "Ať se stará renderer" znamená, 
že každý pisatel si bude smolit nějakou svoji interpolaci -
v horším případě se nebude obtěžovat vůbec, a zláme to hlava nehlava.

HPM




Další informace o konferenci talk-cz