[OSM-talk-fr] Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'
Rpnpif
rpnpif at trob.eu
Ven 12 Fév 10:45:47 UTC 2021
Le 18/01/2021 à 01:37, Philippe Verdy a écrit :
> "fr-PF" pour BCP47 signifie la langue française telle que
> parlée/écrite en Polynésie française ("PF": pas un code de langue mais
> un code de région géographique issu de ISO 3166-1)
> Normalement les code BCP47 n'ont pas de casse significative, et le "_"
> et le "-" sont équivalents.
>
> Cependant dans OSM on n'utilise que les formes canoniques des
> identifiants de langue BCP47 (minuscules partout sauf pour les codes
> région à 2 lettres de l'ISO 3166-1 considérés comme quasi-obsolètes
> pour cet usage depuis l'arrive de l'ISO 639-3 qui a codé plein de
> langues uniques à 3 lettres qui auparavant étaient "réunies" sous un
> même code à 2 lettres ISO 639-1 ou -2 pour une "macrolangue", voire
> parfois toute une famille (désormais dans ISO 639-5; l'autre exception
> étant les codes d'écritures ISO 15924 à 4 lettres dont la forme
> canonique n'a que la première lettre en initiale; tout le reste étant
> en minuscule, les sous-labels composés de 1 à 8 lettres ou chiffres
> étant séparés "canoniquement" par un "-").
>
> je ne vois pas quel usage peut avoir "fr-PF" en Polynésie française
> (cela ne peut pas désigner même les langues polynésiennes, ni des
> créoles à base de javanais ou d'autres langues austronésiennes, qui
> ont leur propre code ISO 639-3 à 3 lettres; les créoles de français ou
> d'anglais et de javanais ne sont pas des dialectes régionaux du
> français; il y a éventuellement un parler "caldoche" en
> Nouvelle-Calédonie, ayant conservé des formes régionales du français
> d'oil d'origine normande, mais le français standard s'est imposé
> depuis longtemps et les dialectes se sont perdus même avec les
> populations migrantes venues d'autres régions d'outre-mer ou ancienne
> colonies françaises d'Afrique et d'Asie du sud-est, ou migrants venus
> de ces pays devenus indépendants depuis : il n'y a pas de variété
> régionale réellement autochtone du français en Polynésie, les langues
> autochtones étant presque toutes austronésiennes ou d'une ancienne
> origine formosane, voire chinoise moderne bien plus récemment en même
> temps que les autres colonisations modernes).
Bonjour,
Je me permets de relancer ce sujet.
Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au
minimum. Cela résout la plupart des problèmes de caractères. Cela
remplace la plupart des ISO-machin qui sont obsolètes dans la plupart
des logiciels et étaient utiles il y a 30 ans quand il restaient des
équipements et logiciels informatiques bridés à 7 ou 8 bits/mots.
En quoi c'est un crime d'avoir un caractère exotique et pas
franco-français (c'est quoi d'ailleurs à part du nationalisme) dans un
nom, surtout un nom propre. Du temps des machines à écrire manuelles
avec leur AZERTY pourri, c'était compréhensible, mais en 2021, cela
signifie quoi ?
Cette discussion a déjà eu lieu ailleurs il y a 20 ans et a été résolu
en basculant les systèmes d'exploitation à l'UTF-8 (ou +).
Ce n'est parce que le courriel véhicule encore des ISO-machin, l'ASCII
et autres antiquités totalement inutiles pour des raisons historiques et
en partie à l'époque de nationalisme américain (qui s'affaiblit
d'ailleurs) qu'il faut continuer.
Même les IOT qui était encore un prétexte il y a 15 ans, se sont mis à
l'UTF-8, mais quelque chose m'échappe peut-être.
--
Rpnpif
Plus d'informations sur la liste de diffusion Talk-fr