<div dir="ltr"><div>I think it would be best to make the tools we use JOSM, Overpass API, iD, etc. Unicode aware, so they can handle this correctly.<br><br></div>Polyglot<br></div><div class="gmail_extra"><br><div class="gmail_quote">2018-01-26 16:50 GMT+01:00 Matej Lieskovský <span dir="ltr"><<a href="mailto:lieskovsky.matej@gmail.com" target="_blank">lieskovsky.matej@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">@marc: I just realized - I'm not talking about breaking words between<br>
syllables but about breaking lines between words. It is not adding a<br>
character, just using a nonbreakable version of a space. Sorry if I'm<br>
not being clear.<br>
<br>
On 26 January 2018 at 16:47, Matej Lieskovský<br>
<div class="HOEnZb"><div class="h5"><<a href="mailto:lieskovsky.matej@gmail.com">lieskovsky.matej@gmail.com</a>> wrote:<br>
> In Czech, a nonbreakable space should follow any single-letter<br>
> preposition or conjunction and academic or military titles. A<br>
> nonbreakable space should also be used due to some common<br>
> contractions, between a number and a unit, and around some punctuation<br>
> marks.<br>
><br>
> I noticed that some Overpass queries were not returning some elements<br>
> - that is how I found out that we actually have a rather large number<br>
> of nonbreakable spaces in the data.<br>
><br>
> Nonbreakable spaces are currently quite troublesome - not all<br>
> consumers actually use Unicode collation, it is invisible in JOSM and<br>
> it is not exactly easy to input. Also, the chance that we convince all<br>
> contributors to use it correctly is exactly zero. Along with this<br>
> potentially being "tagging for the renderer", there are many calls for<br>
> a mass-removal.<br>
><br>
> On the other hand, there is software that actually handles Unicode<br>
> collation well and it does make the correct rendering of names an<br>
> order of magnitude easier. Leaving this up to the renderer sounds<br>
> logical, but imagine forcing every renderer to figure out what<br>
> language any given name is in and then running the appropriate<br>
> subprogram to fill in the nonbreakable spaces. This could require<br>
> semantic analysis due to the need to add a nonbreakable space after<br>
> the "V" in "V jámě" (preposition) but before the "V" in "Jiří V."<br>
> (roman ordinal number) and after the "V." in "V. Špidla" (contraction<br>
> of name (and yes, there are cases when you should use a contraction)).<br>
><br>
> Nonbreakable spaces are strange - you cannot reliably tell if they are<br>
> used OTG (but in some cases you can), official documents often ignore<br>
> them (leaving them up to the automated systems in office software, so<br>
> they do occur sometimes) and the rules governing them are older than<br>
> computers, so asking if they are a rule or a character is... dubious.<br>
><br>
> And yes, we do have really long names of things. Names of POIs named<br>
> after people are a common use case.<br>
><br>
> Matej<br>
><br>
> On 26 January 2018 at 16:11, marc marc <<a href="mailto:marc_marc_irc@hotmail.com">marc_marc_irc@hotmail.com</a>> wrote:<br>
>> Le 26. 01. 18 à 15:48, Matej Lieskovský a écrit :<br>
>>> Several Slavic languages have rather formal rules about line breaks.<br>
>><br>
>> it depends on whether it is a grammar rule or a "char".<br>
>> In French, it is a rule to know how to cut a word at the end of a line.<br>
>> Since it's a grammar rule, I don't see any point in adding a character<br>
>> between syllables to describe it. it's up to the render<br>
>> to know when it can do it if ppl wants this feature.<br>
>> I know nothing about your language, but I feel it look like the same.<br>
>> If my understanding is correct, I am in favour of not putting<br>
>> this "nonbreakable" information into a value and moving it to app code<br>
>> that need it (witch ? have you so long value that's needed to break it<br>
>> in several line ?)<br>
>><br>
>> Regards,<br>
>> Marc<br>
>> ______________________________<wbr>_________________<br>
>> Tagging mailing list<br>
>> <a href="mailto:Tagging@openstreetmap.org">Tagging@openstreetmap.org</a><br>
>> <a href="https://lists.openstreetmap.org/listinfo/tagging" rel="noreferrer" target="_blank">https://lists.openstreetmap.<wbr>org/listinfo/tagging</a><br>
<br>
______________________________<wbr>_________________<br>
Tagging mailing list<br>
<a href="mailto:Tagging@openstreetmap.org">Tagging@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/tagging" rel="noreferrer" target="_blank">https://lists.openstreetmap.<wbr>org/listinfo/tagging</a><br>
</div></div></blockquote></div><br></div>