[Talk-cz] Nedělitelná mezera v OSM datech
Jan Macura
macurajan na gmail.com
Středa Leden 18 21:35:16 UTC 2017
Ahoj,
2017-01-18 10:03 GMT+01:00 Karel Volný <kavol na seznam.cz>:
> obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma
>
Zalomení řádku je záležitost formy. Při každém zpracování textu může
dopadnout jinak (jinde). Obsah je na formátování řádek nezávislý. Takže
medle celá problematika "kde řádek zalomit" padá na hlavu zpracovatele dat.
> kontrolní dotaz - používání malých a velkých písmen je obsah nebo forma?
>
To záleží na kontextu. Obecně samozřejmě formy, ale v našem případě, tj.
sbírání a uchovávání místopisných názvů je extrémně výhodné, aby velikost
písmen byla přímo brána jako součást obsahu (neměnná). Neexistuje totiž
případ, kdy bychom ta slova uvažovali samostatně (slovo "libčice", slovo
"nad" a slovo "vltava") – OSM není ani výkladový slovník ani lexikografická
databáze.
>
> > Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí
> > zpracování dat, ne jejich uložení.
>
> skutečně toto vše? - takže bychom vlastně neměli mít "Libčice nad Vltavou"
> ale
> "Libčice nad Vltava"? :-)
>
>
Heh, napsal jsem to moc obecně :-) Jasně, že v našem případě "Libčice nad
Vltavou", ale tahle diskuse ("zaveďme do slov nedělitelné mezery, protože
to ulehčí zpracování") by taky mohla vést k tomu, že zavedeme tagy
name:genitiv="Libčic
nad Vltavou", name:dativ="Libčicím nad Vltavou", atd. protože "routovací
enginy nabízejí uživateli i textový popis cesty a tohle jim ulehčí práci".
A to už bychom v OSM opravdu mít neměli ;-)
H.
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20170118/95f356e0/attachment.html>
Další informace o konferenci talk-cz