[OSM-talk-fr] [osm-fr CA] Table ronde Langues de France et numérique

Philippe Verdy verdy_p at wanadoo.fr
Mar 4 Déc 15:33:18 UTC 2012


Là encore le Wiki d'OSM se trompe: ISO 639-1 n'est pas directement un code
destiné à la traduction. ISO 639-1 est terminologique à la base, pas
lexicologique. ISO 639-2 est surtout destiné à la classification
bibliographique et inclut la classification terminologique dedans mais pour
faire certeines distinctions, les codes bibliographiques non destinés à
coder la langue ou la terminologie sont parfois distingués, surtout pour
les langues majeures qui ont des tonnes de variantes ignorées dans la
classification bibliographique.

ISO 639-3 ne contient AUCUN code de classification bibliographique, ni
terminologique, leur usage est bien lexicologique et grammatical (mais pas
lexicographique, l'écriture utilisée ou la convention orthographique
n'étant pas utilisée). De plus il n'y a AUCUN code spécial, ou réservé, ni
nouvelle macrolangue (pas au départ), ni collections de langues dans ISO
639-3, mais ISO 639-3 reprend les autres codes ISO 639-2 terminologiques
des langues considérées comme individuelles). ISO 639-3 peut aussi être
amené à changer une langue individuelle en macro-langue, pour coder de
nouvelles distinctions lexicologiques ou grammaticales.

Pour réunir tout ça pour la localisation et les traductions, la référence
c'est BCP 47 qui fait le tri et retient les codes à utiliser (mais avec une
interprétation NON exclusive des groupes de langues ISO 639-2 dits «
résiduels », contrairement à ISO 639-5 qui n'est pas utilisé dans ISO
639-3, ni dans BCP 47 (sauf pour BCP 47 pour les codes collectifs
ISO-639-2, résiduels ou inclusifs, pour des raisons de compatibilité
ascendante).

Plus aucune nouvelle famille de langue ne sera codée comme un « groupe
résiduel » dans ISO 639-5, elles seront toutes inclusives, et jamais codées
dans ISO 639-3, ni ISO-639-2 et même ISO 639-1 dont les registres sont clos
(sauf correction nécessaire pour en faire SOIT des collections de langues
selon ISO 639-5 rassemblant des langues individuelles (non précisées) de
l'ISO 639-3, SOIT des macro-langues restant dans ISO 639-3 mais dont ISO
639-3 énumère la liste exhaustive des langues individuelles codées aussi
dans l'ISO 639-3).

A l'heure actuelle, les collections inclusives ou résiduelles de l'ISO
639-5 ne sont pas énumérées, la classification des familles étant encore
sujète à débat. Ce n'est pas le cas des macro-langues qui sont créées "ad
hoc" dans ISO 639-3 justement pour distinguer des langues individuelles
auparavant considérées comme une seule (avec des variétés dialectales alors
non distinguées, qu'elles soient régionales, ou selon l'âge, le sexe, le
rang social... mais qui deviennent des langues à part entière, mais encore
sans distinction de l'écriture et de l'orthographe).

Il n'existe pratiquement aucun logiciel à se servir DIRECTEMENT de l'ISO
639 (sauf ceux qui se basent encore uniquement sur ISO 639-1 et se limitent
aux codes à 2 lettres et utilisent encore les distinctions régionales avec
les codes pays, par exemple zh-TW ou zh-CN, une pratique qui n'est PLUS DU
TOUT recommandée et remplacée par la codification des macrolangues dans ISO
639-3).

La norme actuelle pour la localisation des logiciels et les traductions
cela reste BCP 47 (actuellement RFC 4646 ou suivants) qui décrit en détail
l'utilisation du registre IANA des étiquettes de langues pour BCP 47. Pas
d'inquiétude : tous les codes ISO 639-3 et ISO 639-5 y sont décrits, au
moins en tant qu'alias vers les codes plus courts recommandés quand ils
existent dans ISO 639-1 (c'est même le cas des cods ISO 639 qui ont été
supprimés ou remplacés/fusionnés : BCP 47 les redéfinit alors comme alias,
si possible, ou les laisse dans leur forme ambiguë si aucun remapping vers
un code "préféré" n'est clair.

Avantage : les traductions codées avec BCP 47 restent stables, même si la
norme ISO 639 change ou retire des codes (ils sont bien retirés de l'ISO
639 mais encore utilisables dans BCP47 même s'ils ne sont plus recommandés
pour les nouveaux documents).

BCP 47 rend également stable les codes d'écriture à 4 lettres de l'ISO
15924, et les codes géographiques à 2 lettres de pays et territoires de
l'ISO 3166-1 ou les codes géographiques à 3 chiffres pour les continents et
sous-continent d'UN M.59, et BCP 47 permet AUSSI des distinctions de
variétés dialectales non codées directement dans ISO 639 (ce projet prévu
de codification des dialectes dans futur un volet 6 de l'ISO 639, avec des
codes à 5 lettres ou plus n'est pas encore abouti, il va falloir des énnées
pour ça. les codes à 5 lettres ou plus restent TOUS réservés dans ISO 639,
comme dans BCP 47, les codes à 4 lettres servant à autre chose : la
maintenance des codes ISO 639-1/2/3/5 retirés, objet du volet 4 de l'ISO
639).

Le 4 décembre 2012 15:34, Christophe Merlet <redfox at redfoxcenter.org> a
écrit :

> Le mardi 04 décembre 2012 à 14:23 +0100, Philippe Verdy a écrit :
> > A mon avis il cherchait "alsacien" sous le code "als" (mauvais code
> > encore utilisé par Wikipédia pour son nom de domaine et ses liens
> > interwikis, et qui est en conflit avec une autre langue définie dans
> > ISO 639-3) et ne sait pas que gsw="alémanique" inclut l'alsacien.
>
> A mon avis, et encore je ne suis pas certain de savoir ce que je sais ni
> ce que je fais, ni même quand je le fais, mais je crois m'être limité,
> limité car je ne suis pas omniscient, aux code ISO 639-1 qui sont censé
> être utilisé pour la balise name:XX d'après le wiki
> https://wiki.openstreetmap.org/wiki/Key:name
>
>
> Je note cependant la présence dans OSM de langues sans reconnaissance
> officielle ayant un nombre significatif de balises et n'exclue pas la
> possibilité de rajouter une carte dédié.
>
>
> Je pense que RatZillaS apportera un éclairage intéressant sur le statut
> de ces langues suite à la table ronde, sujet de ce fil de discussion.
>
>
>
>         Librement,
> --
> Christophe Merlet (RedFox)
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-fr
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20121204/740d31d3/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr