Concept

Mojibake

Concepts associés (9)

Les codages de caractères ASCII étendu, aussi connus dans leur dénomination anglaise extended ASCII, sont un ensemble de jeux de codage de caractères qui ont en commun le sous-ensemble de caractères ASCII. Ce terme est informel et peut être critiqué pour deux raisons : d'une part cette dénomination pourrait laisser penser que le standard ASCII aurait été étendu, alors qu'il désigne en fait un ensemble de normes qui incluent le sous-ensemble ASCII ; d'autre part, l'ASCII étendu ne désigne pas un codage de caractère donné mais un ensemble imprécis de normes précisant chacune un codage de caractères surensemble de l'ASCII.

Fin de ligne

Dans un fichier texte, plusieurs conventions incompatibles existent pour représenter la fin de ligne ou la fin de paragraphe. Les trois conventions principales trouvent leur origine dans des systèmes d’exploitation concurrents. Dans la convention « Unix », la fin de ligne est indiquée par le caractère saut de ligne (, code 10 de la table ASCII). C’est la convention suivie entre autres par les systèmes Multics, Unix, de type Unix (Linux, AIX, Xenix, Mac OS X), BeOS, AmigaOS, et RISC OS.

Windows code page

Windows code pages are sets of characters or code pages (known as character encodings in other operating systems) used in Microsoft Windows from the 1980s and 1990s. Windows code pages were gradually superseded when Unicode was implemented in Windows, although they are still supported both within Windows and other platforms, and still apply when Alt code shortcuts are used. There are two groups of system code pages in Windows systems: OEM and Windows-native ("ANSI") code pages. (ANSI is the American National Standards Institute.

ISO/CEI 8859-15

L'ISO/CEI 8859-15 (aussi connue comme Latin-9 et non officiellement comme Latin-0, mais jamais comme Latin-15) est la de la norme de codage de caractères ISO/CEI 8859 de l'Organisation internationale de normalisation (ISO). Cette norme donne un code numérique tenant sur aux caractères de l'alphabet latin utilisés en allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes).

UTF-16

UTF-16 est un codage des caractères définis par Unicode, où chaque caractère est codé sur une suite de un ou deux mots de 16 bits. Le codage était défini dans le rapport technique 17, annexé à la norme Unicode. Depuis, cette annexe est devenue obsolète car UTF-16 fait partie intégrante de la norme Unicode, dans son chapitre 3 Conformance, qui la définit de façon très stricte. L'UTF-16 ne doit pas être confondu avec l'UCS-2 qui est le codage, plus simple, de chaque caractère sur deux octets.

Tiret

vignette|Tirets typographiques. Le tiret est un signe de ponctuation. Il ne doit pas être confondu avec le trait d’union ni avec le signe moins. Il existe trois types de tirets, selon leur longueur : le tiret long (), le tiret moyen () et le tiret court (), ainsi que le double tiret. Le trait d'union ne peut être considéré comme un tiret. Il est aussi appelé “division” en typographie. Le tiret long ou « tiret cadratin » (« — » Unicode U+2014 HTML — — — digicode A-0151; TeX ---) a plusieurs fonctions.

Guillemet

Le guillemet est un signe typographique de ponctuation, principalement utilisé par paire d’un guillemet ouvrant et d’un guillemet fermant. Leurs formes (simple ou double, en chevron ou en apostrophe) et positions (gauche ou droite) varient selon les langues, les régions ou la direction du système d’écriture utilisé. Le principal usage des guillemets est de mettre en relief une expression, un terme ou une citation. Les guillemets s’emploient ainsi pour le discours rapporté et les dialogues.

UTF-8

UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.

Short Message Service

vignette|Affichage d'un SMS en néerlandais. vignette|Affichage d'un SMS en anglais d'une alerte incendie sur un iPhone. Le service de messagerie SMS, plus connu sous le sigle de SMS (pour « Short Message Service ») ou les noms de « texto » ou de « minimessage », permet de transmettre de courts messages textuels. C'est l'un des services de la téléphonie mobile (il a été introduit par la norme GSM). Dans certaines régions du monde comme l’Amérique du Nord, le Royaume-Uni ou les Philippines, on parle de « messagerie texte ».