Je suis Charlie

Autres trucs

Accueil

Seulement les RFC

Seulement les fiches de lecture

Mon livre « Cyberstructure »

Ève

ISO 639-3, la nouvelle liste de langues

Première rédaction de cet article le 14 février 2007
Dernière mise à jour le 11 janvier 2010


Après une longue genèse, la nouvelle itération de la norme ISO 639 sur les langues humaines a été publiée le 5 février 2007.

ISO 639 normalise une liste de langues et un code (d'abord à deux lettres, désormais à trois) pour chaque langue. fr est le français, cop le copte, cy le gallois, etc. Cette norme sert de base à bien d'autres normes, par exemple les étiquettes de langue que l'IETF a normalisées dans le RFC 5646. La nouvelle itération de ISO 639 marque deux changements importants :

  • Une nouvelle agence de maintenance, SIL, dont le travail est très apprécié mais qui a suscité des controverses, notamment pour son activité trop... missionnaire dans les pays du Sud,
  • Un bond considérable du nombre de langues, qui passe de moins de cinq cents à plus de sept mille.

Cette augmentation n'a pas été sans mal puisque les premières itérations, ISO 639-1 et ISO 639-2, ne prenaient en compte que des langues établies, normalisées et bien connues. Désormais, des langues nettement plus marginales sont enregistrées, et il est souvent très difficile de savoir si deux de ces langues sont différentes ou pas.

D'autres changements font leur apparition comme la notion de macrolangue, permettant de traiter des cas complexes d'apparentement de langues.

Parmi les nouvelles langues, notons au hasard :

Opinion personnelle : la distribution des macrolangues dans ISO 639-3 est assez arbitraire. Il devrait logiquement y avoir une macrolangue « allemand » qui couvre l'allemand standard et l'alémanique. Mais elle n'existe pas, alors qu'elle serait aussi raisonnable que la macrolangue Cri, qui couvre apparemment des langues très différentes.

Comme d'habitude, l'ISO, organisation privée et fermée, ne distribue pas la norme, mais la vend cher. Heureusement, elle est disponible via le site Web de l'agence de maintenance.

Plusieurs systèmes d'exploitation intégrent un fichier contenant tous les codes définis par cette norme. Par exemple, pour Debian, c'est en CSV et c'est dans le paquetage iso-codes pour lequel une version intégrant 639-3 est en préparation.

Le RFC intégrant ISO 639-3, le RFC 5646, préparé par le groupe de travail LTRU de l'IETF, a été publié en septembre 2009.

Pendant ce temps, les gens qui travaillent sur la norme ISO n'étaient pas restés inactifs et avaient publié ISO 639-5, qui normalise les relations entre les langues. ISO 639-6, pour les dialectes, est encore en cours. On peut avoir une idée des développements actuels en lisant l'article Developments in Language Codes standards, écrits par Gillam, Garside et Cox, trois des participants à l'ISO 639.

Version PDF de cette page (mais vous pouvez aussi imprimer depuis votre navigateur, il y a une feuille de style prévue pour cela)

Source XML de cette page (cette page est distribuée sous les termes de la licence GFDL)