[Talk-cz] Nedělitelné mezery v názvech ulic
Petr Kadlec
petr.kadlec na gmail.com
Čtvrtek Leden 18 20:46:09 UTC 2018
2018-01-18 20:45 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>:
> Overpass to bere s přesností na znak nebo na binární iterpretaci?
> Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou
> sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to
> chyba
> toho softwaru.
>
Ano, a zjevně je to přesně tak, viz seznam omezení na
https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters
(pokud vstup není v NFC, nebude to fungovat; třeba „way["name"="Na
Rybníčku"]“; i když tohle se dá ještě relativně snadno řešit automaticky
na vstupu (dokud se pohybujeme v češtině, kde se nic složitějšího
nevyskytuje)). O složitějších případech nemluvě (jako třeba hledání bez
diakritiky).
V zásadě si Overpass asi představuje, že si to každý ošetří stylem
way["name"~"^V[ \u00A0]Tůních$"]
O implementaci Overpassu nic moc nevím, takže netuším, kolik práce by bylo
to nějak opravit/dodělat.
-- Petr Kadlec / Mormegil
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/643ed1f7/attachment.html>
Další informace o konferenci talk-cz