Je suis Charlie

Autres trucs

Accueil

Seulement les RFC

Seulement les fiches de lecture

Mon livre « Cyberstructure »

Ève

Version 16 d'Unicode

Première rédaction de cet article le 14 septembre 2024


Le 10 septembre est sortie la version 16 d'Unicode. Une description officielle des principaux changements est disponible mais voici ceux qui m'ont intéressé particulièrement. (Il n'y a pas de changement radical.)

Pour explorer plus facilement la grande base Unicode, j'utilise un programme qui la convertit en SQL et permet ensuite de faire des analyses variées. Faisons quelques requêtes SQL :

ucd=> SELECT count(*) AS Total FROM Characters;
 total  
--------
 155063

Combien de caractères sont arrivés avec la version 16 ?

ucd=> SELECT version,count(version) FROM Characters GROUP BY version ORDER BY version::float;
...
 13.0    |  5930
 14.0    |   838
 15.0    |  4489
 15.1    |   627
 16.0    |  5185

5 185 nouveaux caractères, c'est pas mal, la plus grosse addition depuis la version 13.0. Quels sont ces nouveaux caractères ?

ucd=> SELECT To_U(codepoint) AS Code_point, name FROM Characters WHERE version='16.0' ORDER BY Codepoint;
 code_point |                                    name                                    
-----------+----------------------------------------------------------------------------
 U+A7CB     | LATIN CAPITAL LETTER RAMS HORN
 U+A7CC     | LATIN CAPITAL LETTER S WITH DIAGONAL STROKE
 …
 U+10D50    | GARAY CAPITAL LETTER A
 U+10D51    | GARAY CAPITAL LETTER CA
 U+10D52    | GARAY CAPITAL LETTER MA
 …
 U+11BC2    | SUNUWAR LETTER EKO
 U+11BC3    | SUNUWAR LETTER IMAR
 U+11BC4    | SUNUWAR LETTER REU
 …
 U+1346E    | EGYPTIAN HIEROGLYPH-1346E
 U+1346F    | EGYPTIAN HIEROGLYPH-1346F
 U+13470    | EGYPTIAN HIEROGLYPH-13470
 …
 U+1CC15    | LOGIC GATE OR
 U+1CC16    | LOGIC GATE AND
 …
 U+1CC4A    | FLYING SAUCER WITH BEAMS
 U+1CC4B    | FLYING SAUCER WITHOUT BEAMS
 …
 U+1CC4E    | ALIEN SQUID OPEN TENTACLES
 U+1CC4F    | ALIEN SQUID CLOSED TENTACLES
 …
 U+1CC60    | LEFT-POINTING ATOMIC BOMB
 U+1CC61    | UP-POINTING ATOMIC BOMB
 …
 U+1CE20    | LARGE TYPE PIECE CROSSBAR WITH LOWER STEM
 U+1CE21    | LARGE TYPE PIECE UPPER HALF VERTEX OF M
 U+1CE22    | LARGE TYPE PIECE DIAGONAL LOWER LEFT
 …

Cette version amène en effet plusieurs nouvelles écritures. C'est le cas du Sunuwar, par exemple. On voit aussi arriver le Garay. Cette dernière écriture ne semble d'ailleurs pas avoir tellement eu de succès, le nom de domaine du site officiel, garay-ecriture.com a disparu en 2012. Parmi les nouveautés, beaucoup d'hiéroglyphes égyptiens, et l'habituelle arrivée d'emojis comme les différentes variantes d'extra-terrestres, avec ou sans tentacules (bon, d'accord, ceux-là ne sont pas officiellement des emojis, ils ont été enregistrés via une autre voie mais ils seront sans doute utilisés comme des emojis).

Revenu du passé, le jeu de caractères des machines Sharp MZ est désormais inclus. Cela apporte notamment les symboles des circuits électroniques.

Si vous avez les bonnes polices de caractères, vous allez pouvoir voir quelques exemples (sinon, le lien mène vers Uniview). Voici par exemple le grand S barré , la première lettre de l'alphabet garay 𐵊, celle du sunuwar 𑯀, un des nouveaux et nombreux hiéroglyphes 𓑠, une diode 𜰎 et un extra-terrestre 𜱌.

Version PDF de cette page (mais vous pouvez aussi imprimer depuis votre navigateur, il y a une feuille de style prévue pour cela)

Source XML de cette page (cette page est distribuée sous les termes de la licence GFDL)