<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">2018-01-18 20:45 GMT+01:00 Lukáš Karas <span dir="ltr"><<a href="mailto:lukas.karas@centrum.cz" target="_blank">lukas.karas@centrum.cz</a>></span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Overpass to bere s přesností na znak nebo na binární iterpretaci?<br>
Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou<br>
sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to chyba<br>
toho softwaru.<br></blockquote><div><br></div><div>Ano, a zjevně je to přesně tak, viz seznam omezení na <a href="https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters">https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters</a> (pokud vstup není v NFC, nebude to fungovat; třeba „way["name"="Na Rybníčku"]“; i když tohle se dá ještě relativně snadno řešit automaticky na vstupu (dokud se pohybujeme v češtině, kde se nic složitějšího nevyskytuje)). O složitějších případech nemluvě (jako třeba hledání bez diakritiky).<br></div><div><br></div><div>V zásadě si Overpass asi představuje, že si to každý ošetří stylem<br></div><div><br></div><div>way["name"~"^V[ \u00A0]Tůních$"]</div><div><br></div><div></div><div>O implementaci Overpassu nic moc nevím, takže netuším, kolik práce by bylo to nějak opravit/dodělat.</div><div><br></div><div>-- Petr Kadlec / Mormegil<br></div></div><br></div></div>