[OSM-talk-fr] Pour info : les langues polynésiennes sur la liste anglophone

Philippe Verdy verdy_p at wanadoo.fr
Jeu 13 Sep 01:04:30 UTC 2012


2012/9/12 Christian Rogel <christian.rogel at club-internet.fr>:
> Je signale, par exemple, aux habitants de Kanaky-Nelle-Calédonie (private
> joke pour henryk ;-) ), qu'un débat très pointu sur les langues
> polynésiennes se déroule actuellement sur la liste OSM anglophone.
> Tahiti, les Marquises et Touamotou sont aussi concernées, car on y parle de
> la manière d'indexer leurs langues dans OSM.

Juste pour info, un des débats porte sur le choix des codes de
langues. Le choix n'est pas en fait entre ISO 639-1 ou -2 (codes à
deux lettres) ou ISO 639-3 (codes à 3 lettres) mais dans la norme
établie pour l'indexation des contenus sur le web et dans
l'informatique : BCP 47.

Les normes ISO 639 ne sont pas stables et ont été établies dans
d'autres buts (l'indexation bibliothécaire pour les références et
classifications bibliographiques et non réellement pour distinguer
correctement et précisément les langues)

BCP 47 ne reprend qu'une partie des codes ISO 639, en commençant par
les plus courts, et quand il y a le choix (entre ISO 639-2/T et ISO
639-2/B il prend le premier), et dans le choix pris à un instant donné
de ne conserver qu'un seul code (les autres devenant seulement parfois
des alias, non recommandés mais conservés pour compatibilité
ascendante, même s'ils ont été retirés des normes ISO 639) mais pas
tous non plus.

Pour savoir quel code utiliser c'est le registre IANA des "language
subtags" qui compte.

Attention : Wikipedia a aussi fait ce choix (mais tardivement, ce qui
a laissé des codes incohérents mais qui seront gardés, sauf en cas de
conflit avec des labels de noms de domaines réservés comme "www"). Ces
codes Wikipedia ne sont à utiliser que pour les tags "wikipedia=<code
interwiki de Wikipedia>:<Titre de l'article>". Pour les traductions
comme "name;<code langue>" ce sont les codes BCP 47 qu'il faut
utiliser.

Certaines petites éditions de Wikipédia ont vu leur code langue
changer (mais il a fallu garder un alias dans le nom du domaine pour
éviter de rompre des liens web depuis d'autres sites).

Note: BCP 47 fait référence à une série de RFC (leur numéro peut
évoluer, des RFC deviennent obsolètes et sont remplacées par d'autres,
mais au sein du registre IANA aucun code langue n'est retiré, même si
certains deviennent des alias et ne sont plus recommandés mais sont
toujours valides).

BCP 47 est aussi la référence fait sur les bases de traductions en
ligne (comme Translatewiki.net, utilisé par exemple pour traduire
Mediawiki, comme aussi JOSM), ainsi que dans toutes les standards du
web et des réseaux (du W3.org, et de l'IETF pour toutes les RFC et
BCP).

Par conséquent pour le tahitien, c'est sans ambiguité le code langue
"ty" qu'on doit utiliser (pas de différence pour cette langue avec le
code Interwiki pour Wikipédia).




Plus d'informations sur la liste de diffusion Talk-fr