[Talk-cz] Nedělitelné mezery v názvech ulic

Matej Lieskovský lieskovsky.matej na gmail.com
Úterý Leden 23 21:32:00 UTC 2018


Zase na druhou stranu platí, že pokud se budeme omezovat na to, co zvládá
již existující software, tak se nikdy nikam neposuneme. Minimálně výhledově
mi přijde jako správné se posouvat směrem k plnohodnotnému Unicode.
Souhlasím, že se bílé znaky blbě debugují, ale minimálně bychom mohli
protlačit do editorů možnost zobrazovat bílé znaky.
Vlna má základní problém v tom, že musíš hlídat, ve kterém jazyce který
název je a spoustu podobných blbostí. Například pokud zahodíme i římské
číslice, tak bude potřeba tipovat, zda je to "v" nebo římská číslice pět.

Část debaty je vlastně o tom, zda je snažší doplňovat nebo zahazovat nbsp.
Mně přijde, že se data vždy snadněji zahazují, ale je otázka, jak často je
co z toho potřeba. Ono se taky může stát, že teď budeme nbsp mazat a za pár
let zase přidávat, protože se SW zlepší.

2018-01-23 22:06 GMT+01:00 Mikoláš Štrajt <strajt9 na seznam.cz>:

> Nbsp IMHO do dat nepatří.
>
> Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve smyslu
> ASCII/UTF-8 znak 32). Domnívám se, že nad daty OSM operuje dost věcí, které
> namejí skutečnou podporu Unicode a spíše zneužívají toho, že UTF-8 je
> zpětně kompatibilní s ASCII.
>
> Kromě toho, bílé znaky se strašně těžko debugují.
>
> V diskuzi výše byl zmíněn program vlna. Mám za to, že by bylo lepší
> nedělitelné mezery přidávat až před vykreslováním v preprocesingu.
>
> Například německá verze OSM provádí podobným způsobem transliterace
> nelatinkových abeced.
>
> --
> Mikoláš Štrajt  / Severák
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/78bb69ce/attachment.html>


Další informace o konferenci talk-cz