UTF-8UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.
Caractère (informatique)En informatique, un caractère est . Comme en typographie, un caractère informatique peut représenter une lettre , une lettre majuscule, un chiffre, un signe de ponctuation ; mais aussi un espace, une tabulation, un retour à la ligne et quelques autres opérations spéciales (sonnerie, effacement, etc.) qui ne représentent pas des symboles (caractères de contrôle). En informatique, la notion de caractère est une notion qui dans le principe associe à un glyphe un nombre, de manière à dissocier la représentation physique du caractère de sa signification.
PonctuationLa ponctuation a pour but l’organisation de l’écrit grâce à un ensemble de signes graphiques. Elle a trois fonctions principales. Elle anime le texte en indiquant des faits de la langue orale, comme l’intonation ou les pauses de diverses longueurs (indications prosodiques). Elle marque les degrés de subordination entre les différents éléments du discours (rapports syntaxiques). Enfin elle précise le sens et définit les liens logiques entre ces éléments (informations sémantiques).
BrailleLe braille () est un système d’écriture tactile à points saillants, à l’usage des personnes aveugles ou fortement malvoyantes. Le système porte le nom de son inventeur, le Français Louis Braille (1809-1852) qui avait perdu la vue à la suite d'un accident. Élève à l’Institution royale des jeunes aveugles, il modifie et perfectionne le code Barbier. En 1829 paraît le premier exposé de sa méthode. Un document qui n’est pas écrit en braille et qui n’est donc pas lisible par un aveugle est dit « en noir » ou « noir » (un livre en noir, par exemple).
Alphabet perso-arabeL'alphabet perso-arabe est utilisé pour écrire le persan. C’est une forme modifiée de l'alphabet arabe qui comprend 32 caractères principaux. Les quatre lettres additionnelles par rapport à l'arabe sont les suivantes : Les lettres suivantes ne sont pas des lettres nouvelles mais plutôt une forme différente d'écrire des lettres existantes ; et dans le cas de lâm alef, une ligature. Bien qu'elles aient à première vue l'air semblables, il y a de nombreuses différences dans la façon dont différentes langues utilisent des alphabets.
Extended Binary Coded Decimal Interchange CodeL’Extended Binary Coded Decimal Interchange Code (EBCDIC) est un mode de codage des caractères sur créé par IBM à l'époque des cartes perforées. Il existe au moins différentes bien documentées (et de nombreuses variantes parfois créées par des concurrents d’IBM), incompatibles entre elles. Ce mode de codage a été critiqué pour cette raison, mais aussi parce que certains caractères de ponctuation ne sont pas disponibles dans certaines versions. Ces disparités ont parfois été interprétées comme un moyen pour IBM de conserver ses clients captifs.