[Talk-cz] Nedělitelné mezery v názvech ulic

Matej Lieskovský lieskovsky.matej na gmail.com
Pátek Leden 26 15:01:35 UTC 2018


Napsal jsem na Tagging. Očekávám flame za 3... 2... 1...

Jen tak mimochodem:
- hledání to nerozbije, Nominatim umí Unicode Collation
- je to v cca polovině oficiálních seznamů, mimo jiné protože office
to automaticky doplňuje
- teoreticky by se za tagování pro renderer mohly považovat i velká a
malá písmena v názvech ulic (OTG jsou celá velkými)
- rozumně spolehlivé algoritmické doplnění bude řádově složitější než
100% spolehlivé algoritmické odstranění (leda že bys nám laskavě
zveřejnil tvůj program na automatické doplňování nedělitelných mezer)

Problém je v tom, že teď nejen že tam ty nedělitelné mezery občas jsou
(takže co se má rozbít, to se rozbije), ale taky nejsou zdaleka všude
(takže se občas něco renderuje ošklivě a člověka netrkne tak rychle,
co se děje) a občas se dvě části TÉ SAMÉ ULICE liší v tom, zda mají
nedělitelnou mezeru (takže se rozbije i to, co by jinak nedělitelné
mezery zkouslo).

2018-01-26 0:17 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
> Ahoj!
>
>> Vypadá to, že minimálně osm.org nbsp řeší správně:
>> https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366
>> ukazuje, že nic typu "vlna" osm.org nepoužívá
>> https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787
>> ukazuje, že nedělitelné mezery zobrazí správně
>> (Tedy, alespoň to tak vypadá)
>>
>> U ostatních renderů jsem zatím nenašel vhodný případ.
>>
>> Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka
>> je prostá: chceme nbsp v datech, nebo nikoliv?
>>
>> Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi
>> nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých
>> ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto
>> problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně
>> smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se
>> budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu
>> doplňovat tam, kde ji zatím žádný úsek ulice nemá.
>
> Zpetne smazat i zpetne doplnit je stejne tezke -- ta mezera jde
> doplnit algoritmicky -- takze ano, jsem proti 4.
>
> (Protoze to rozbije hledani, protoze to neni v oficialnich seznamech,
> protoze je to tagovani pro renderer, protoze to rozbije lokalni
> programy snazici se pracovat s OSM daty, a protoze neviditelny znaky
> jsou skodoliba past na kohokoliv kdo se s timbude snazit pracovat.)
>
> DWG navrhovala zeptat se na tagging listu, to by asi byl dalsi rozumny
> krok.
>
>                                                                 Pavel
> --
> (english) http://www.livejournal.com/~pavelmachek
> (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>




Další informace o konferenci talk-cz