ISO/CEI 8859-1La norme ISO 8859-1, dont le nom complet est ISO/CEI 8859-1, et qui est souvent appelée Latin-1 ou Europe occidentale, forme la première partie de la norme internationale ISO/CEI 8859, qui est une norme de l’Organisation internationale de normalisation pour le codage des caractères en informatique. Elle définit ce qu’elle appelle l’alphabet latin numéro 1, qui consiste en 191 caractères de l’alphabet latin, chacun d’entre eux étant codé sur un octet (soit 8 bits). ISO 8859-1 reprend le codage des caractères imprimables d’US-ASCII.
ØØ (minuscule ø), appelé o barré ou o barré obliquement, est une lettre utilisée dans les alphabets danois, féroïen et norvégien ; dans les alphabets du chinantèque d’Ozumacín, du chinantèque de Tlacoatzintepec et du tlahuica au Mexique ; dans certains alphabets de langues camerounaises utilisant l’Alphabet général des langues camerounaises dont l’ejagham, le koonzime et le mfumte ; en anuak en Éthiopie ; en lendu en République démocratique du Congo et en Ouganda ; ou encore en shilluk au Soudan du Sud.
Windows code pageWindows code pages are sets of characters or code pages (known as character encodings in other operating systems) used in Microsoft Windows from the 1980s and 1990s. Windows code pages were gradually superseded when Unicode was implemented in Windows, although they are still supported both within Windows and other platforms, and still apply when Alt code shortcuts are used. There are two groups of system code pages in Windows systems: OEM and Windows-native ("ANSI") code pages. (ANSI is the American National Standards Institute.
ISO/CEI 8859-15L'ISO/CEI 8859-15 (aussi connue comme Latin-9 et non officiellement comme Latin-0, mais jamais comme Latin-15) est la de la norme de codage de caractères ISO/CEI 8859 de l'Organisation internationale de normalisation (ISO). Cette norme donne un code numérique tenant sur aux caractères de l'alphabet latin utilisés en allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes).
Points de suspensionLes points de suspension sont représentés par trois points alignés horizontalement au niveau de la ligne de base d’écriture : classiquement par la suite de trois fois le caractère « point » ou par le caractère unique « points de suspension » . Selon l’usage en français et espagnol, , les trois points se suivent sans espace afin de former les points de suspension d’une largeur théorique d’un cadratin. Parfois en anglais, les trois points sont séparés à l’aide d’une espace insécable : .
Mojibakethumb|La Wikipédia en japonais encodé en UTF-8, affiché avec l’encodage Windows-1252. est un emprunt lexical au japonais qui signifie que les caractères affichés à l'écran d'un logiciel informatique ne s'affichent pas correctement, à cause d'un problème de codage. En langage courant et face à élément illisible le français dira . Ce concept est similaire au concept de krakozyabry (кракозя́бры). Les problèmes d'encodage de caractères sont apparus dès que des encodages EBCDIC et ASCII sont apparus dans les .
GuillemetLe guillemet est un signe typographique de ponctuation, principalement utilisé par paire d’un guillemet ouvrant et d’un guillemet fermant. Leurs formes (simple ou double, en chevron ou en apostrophe) et positions (gauche ou droite) varient selon les langues, les régions ou la direction du système d’écriture utilisé. Le principal usage des guillemets est de mettre en relief une expression, un terme ou une citation. Les guillemets s’emploient ainsi pour le discours rapporté et les dialogues.
UTF-8UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.
Unicode inputUnicode input is the insertion of a specific Unicode character on a computer by a user; it is a common way to input characters not directly supported by a physical keyboard. Unicode characters can be produced either by selecting them from a display or by typing a certain sequence of keys on a physical keyboard. In addition, a character produced by one of these methods in one web page or document can be copied into another.
ASCII étenduLes codages de caractères ASCII étendu, aussi connus dans leur dénomination anglaise extended ASCII, sont un ensemble de jeux de codage de caractères qui ont en commun le sous-ensemble de caractères ASCII. Ce terme est informel et peut être critiqué pour deux raisons : d'une part cette dénomination pourrait laisser penser que le standard ASCII aurait été étendu, alors qu'il désigne en fait un ensemble de normes qui incluent le sous-ensemble ASCII ; d'autre part, l'ASCII étendu ne désigne pas un codage de caractère donné mais un ensemble imprécis de normes précisant chacune un codage de caractères surensemble de l'ASCII.