Je suis Charlie

Autres trucs

Accueil

Seulement les RFC

Seulement les fiches de lecture

Mon livre « Cyberstructure »

Ève

L'envers d'ǝpoɔıu∩

Première rédaction de cet article le 5 mai 2010


L'arrivée cet après-midi des premiers « vrais » TLD IDN dans la racine est l'occasion de s'instruire en s'amusant en regardant ce qu'on peut faire de curieux avec Unicode, par exemple, mettre du texte à l'sɹǝʌuǝ.

D'accord, aujourd'hui, c'étaient les trois nouveaux TLD, السعودية. (Arabie saoudite), امارات. (Émirats arabes unis), et مصر. (Égypte) qui étaient en vedette (cf. l'annonce de l'ICANN). Mais cela n'interdit pas de continuer à regarder les autres possibilités du très riche jeu de caractères Unicode, qui contient assez de caractères pour faire des jeux distrayants comme celui proposé par le Unicode Upside-Down Converter. Vous tapez n'importe quel texte, par exemple « J'aime le chocolat avec les fraises » et vous obtenez la version à l'envers, ici « sǝsıɐɹɟ sǝʃ ɔǝʌɐ ʇɐʃoɔoɥɔ ǝʃ ǝɯıɐ,ſ ».

Une fois qu'on a cet « inverseur » de texte, on peut s'amuser à rêver à des noms de domaine IDN plus rigolos par exemple ƃɹo˙ɹǝʎǝɯzʇɹoq˙ʍʍʍ. Le texte étant à l'envers, en enregistrant .ʍʍʍ (qui est de l'IDN légal, cf. RFC 3490), on pourrait créer plein de noms étonnants.

Au fait, comment fonctionne cet inverseur de texte ? En mettant les caractères Unicode dans l'excellent service Uniview, on voit qu'il y a en fait une combinaison de trucs. Même si Unicode est vaste, il n'y a pas forcément une version inversée de chaque caractère. L'inverseur cherche donc à chaque fois un caractère qui, dans la plupart des polices, produit à peu près le même effet. Pour Unicode inversé (« ǝpoɔıu∩ »), cela donne :

  • U+01DD ǝ LATIN SMALL LETTER TURNED E
  • U+0070 p LATIN SMALL LETTER P
  • U+006F o LATIN SMALL LETTER O
  • U+0254 ɔ LATIN SMALL LETTER OPEN O
  • U+0131 ı LATIN SMALL LETTER DOTLESS I
  • U+0075 u LATIN SMALL LETTER U
  • U+2229 ∩ INTERSECTION

On voit que 'o' est son propre inverse, que 'u' fait un bon 'n' inversé, que l'inverse de 'e' existe déjà dans Unicode et que pour 'i' ou 'c', il a fallu recourir à des approximations. Il y a même un caractère mathématique pour faire l'inverse de 'U'.

Merci à Roy Arends pour avoir attiré mon attention sur cette possibilité et à Robert Martin-Legene et Marco Davids pour leur aide afin de comprendre comment cela marche. Merci à Richard Ishida pour Uniview et aussi pour un autre de ses excellents outils, le convertisseur Unicode.

Version PDF de cette page (mais vous pouvez aussi imprimer depuis votre navigateur, il y a une feuille de style prévue pour cela)

Source XML de cette page (cette page est distribuée sous les termes de la licence GFDL)