[Talk-cz] Nedělitelné mezery v názvech ulic

Petr Kadlec petr.kadlec na gmail.com
Čtvrtek Leden 18 20:46:09 UTC 2018


2018-01-18 20:45 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>:

> Overpass to bere s přesností na znak nebo na binární iterpretaci?
> Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou
> sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to
> chyba
> toho softwaru.
>

Ano, a zjevně je to přesně tak, viz seznam omezení na
https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters
(pokud vstup není v NFC, nebude to fungovat; třeba „way["name"="Na
Rybníčku"]“; i když tohle se dá ještě relativně snadno řešit automaticky
na vstupu (dokud se pohybujeme v češtině, kde se nic složitějšího
nevyskytuje)). O složitějších případech nemluvě (jako třeba hledání bez
diakritiky).

V zásadě si Overpass asi představuje, že si to každý ošetří stylem

way["name"~"^V[ \u00A0]Tůních$"]

O implementaci Overpassu nic moc nevím, takže netuším, kolik práce by bylo
to nějak opravit/dodělat.

-- Petr Kadlec / Mormegil
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/643ed1f7/attachment.html>


Další informace o konferenci talk-cz