[OSM-talk-fr] Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Rpnpif rpnpif at trob.eu
Ven 12 Fév 10:45:47 UTC 2021


Le 18/01/2021 à 01:37, Philippe Verdy a écrit :
> "fr-PF" pour BCP47 signifie la langue française telle que 
> parlée/écrite en Polynésie française ("PF": pas un code de langue mais 
> un code de région géographique issu de ISO 3166-1)
> Normalement les code BCP47 n'ont pas de casse significative, et le "_" 
> et le "-" sont équivalents.
>
> Cependant dans OSM on n'utilise que les formes canoniques des 
> identifiants de langue BCP47 (minuscules partout sauf pour les codes 
> région à 2 lettres de l'ISO 3166-1 considérés comme quasi-obsolètes 
> pour cet usage depuis l'arrive de l'ISO 639-3 qui a codé plein de 
> langues uniques à 3 lettres qui auparavant étaient "réunies" sous un 
> même code à 2 lettres ISO 639-1 ou -2 pour une "macrolangue", voire 
> parfois toute une famille (désormais dans ISO 639-5; l'autre exception 
> étant les codes d'écritures ISO 15924 à 4 lettres dont la forme 
> canonique n'a que la première lettre en initiale; tout le reste étant 
> en minuscule, les sous-labels composés de 1 à 8 lettres ou chiffres 
> étant séparés "canoniquement" par un "-").
>
> je ne vois pas quel usage peut avoir "fr-PF" en Polynésie française 
> (cela ne peut pas désigner même les langues polynésiennes, ni des 
> créoles à base de javanais ou d'autres langues austronésiennes, qui 
> ont leur propre code ISO 639-3 à 3 lettres; les créoles de français ou 
> d'anglais et de javanais ne sont pas des dialectes régionaux du 
> français; il y a éventuellement un parler "caldoche" en 
> Nouvelle-Calédonie, ayant conservé des formes régionales du français 
> d'oil d'origine normande, mais le français standard s'est imposé 
> depuis longtemps et les dialectes se sont perdus même avec les 
> populations migrantes venues d'autres régions d'outre-mer ou ancienne 
> colonies françaises d'Afrique et d'Asie du sud-est, ou migrants venus 
> de ces pays devenus indépendants depuis : il n'y a pas de variété 
> régionale réellement autochtone du français en Polynésie, les langues 
> autochtones étant presque toutes austronésiennes ou d'une ancienne 
> origine formosane, voire chinoise moderne bien plus récemment en même 
> temps que les autres colonisations modernes).

Bonjour,

Je me permets de relancer ce sujet.

Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au 
minimum. Cela résout la plupart des problèmes de caractères. Cela 
remplace la plupart des ISO-machin qui sont obsolètes dans la plupart 
des logiciels et étaient utiles il y a 30 ans quand il restaient des 
équipements et logiciels informatiques bridés à 7 ou 8 bits/mots.

En quoi c'est un crime d'avoir un caractère exotique et pas 
franco-français (c'est quoi d'ailleurs à part du nationalisme) dans un 
nom, surtout un nom propre. Du temps des machines à écrire manuelles 
avec leur AZERTY pourri, c'était compréhensible, mais en 2021, cela 
signifie quoi ?

Cette discussion a déjà eu lieu ailleurs il y a 20 ans et a été résolu 
en basculant les systèmes d'exploitation à l'UTF-8 (ou +).

Ce n'est parce que le courriel véhicule encore des ISO-machin, l'ASCII 
et autres antiquités totalement inutiles pour des raisons historiques et 
en partie à l'époque de nationalisme américain (qui s'affaiblit 
d'ailleurs) qu'il faut continuer.

Même les IOT qui était encore un prétexte il y a 15 ans, se sont mis à 
l'UTF-8, mais quelque chose m'échappe peut-être.

-- 
Rpnpif




Plus d'informations sur la liste de diffusion Talk-fr