ASCII étenduLes codages de caractères ASCII étendu, aussi connus dans leur dénomination anglaise extended ASCII, sont un ensemble de jeux de codage de caractères qui ont en commun le sous-ensemble de caractères ASCII. Ce terme est informel et peut être critiqué pour deux raisons : d'une part cette dénomination pourrait laisser penser que le standard ASCII aurait été étendu, alors qu'il désigne en fait un ensemble de normes qui incluent le sous-ensemble ASCII ; d'autre part, l'ASCII étendu ne désigne pas un codage de caractère donné mais un ensemble imprécis de normes précisant chacune un codage de caractères surensemble de l'ASCII.
Barre obliqueLa barre oblique « / », ou par anglicisme le slash, est un caractère typographique. Elle se distingue de la barre oblique inversée « \ ». Avec l'arobase et le tilde, la barre oblique / est l'un des symboles les plus utilisés sur Internet, puisque la double barre oblique est à la tête de l'URI, après l'indication du protocole utilisé (ainsi, avec le protocole HTTP, l’URI commencera par ). C'est aussi, pour la plupart des systèmes d'exploitation, le caractère qui distingue les différents dossiers d'un chemin.
Point d'exclamationUn point d'exclamation, autrefois appelé point d'admiration, est un signe de ponctuation fort qui se met à la fin d'une phrase exclamative, à la place du point. La phrase que termine un point d'exclamation peut soit être une véritable exclamation (« Oh ! »), soit être un ordre (« Halte, vous avez enfreint la loi ! »), ou encore souligner un fait remarquable (« Cet animal est vraiment gigantesque ! »), la surprise, l'exaspération ou l'admiration.
ISO/CEI 8859-1La norme ISO 8859-1, dont le nom complet est ISO/CEI 8859-1, et qui est souvent appelée Latin-1 ou Europe occidentale, forme la première partie de la norme internationale ISO/CEI 8859, qui est une norme de l’Organisation internationale de normalisation pour le codage des caractères en informatique. Elle définit ce qu’elle appelle l’alphabet latin numéro 1, qui consiste en 191 caractères de l’alphabet latin, chacun d’entre eux étant codé sur un octet (soit 8 bits). ISO 8859-1 reprend le codage des caractères imprimables d’US-ASCII.
Deux-pointsLe deux-points, ou double point, est un signe de ponctuation constitué de deux points alignés l’un au-dessus de l’autre. Du point de vue de la syntaxe, le deux-points s’apparente au point-virgule et sépare deux membres de phrase souvent constitués de propositions indépendantes. Le deux-points peut introduire diverses catégories de segments : une citation, dans le discours rapporté direct : une explication, une cause : une conséquence, une synthèse : une énumération : Le Lexique des règles typographiques en usage à l'Imprimerie nationale, ouvrage de référence en typographie française, indique qu'on ne met pas de majuscule après un deux-points, sauf s'il est suivi d'un nom propre ou qu'il introduit une citation.
Extended Binary Coded Decimal Interchange CodeL’Extended Binary Coded Decimal Interchange Code (EBCDIC) est un mode de codage des caractères sur créé par IBM à l'époque des cartes perforées. Il existe au moins différentes bien documentées (et de nombreuses variantes parfois créées par des concurrents d’IBM), incompatibles entre elles. Ce mode de codage a été critiqué pour cette raison, mais aussi parce que certains caractères de ponctuation ne sont pas disponibles dans certaines versions. Ces disparités ont parfois été interprétées comme un moyen pour IBM de conserver ses clients captifs.
Windows-1252Windows-1252 ou CP1252 (abréviation de « code page – 1252 » , signifiant Page de code – 1252) est un jeu de caractères, utilisé historiquement par défaut sur le système d'exploitation Microsoft Windows en anglais et dans les principales langues d’Europe de l’Ouest, dont le français. Au début des années 1990, l'utilisation du codage Windows-1252 se développe en Occident, avec la diffusion de Windows 3.x. Les caractères codés sont appelés par confusion « ANSI » au lieu d'« occidentaux » (« Western »).
UTF-8UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.
Sed (Unix)sed (abréviation de stream editor, « éditeur de flux ») est, comme awk, un programme informatique permettant d'appliquer différentes transformations prédéfinies à un flux séquentiel de données textuelles. sed lit des données d'entrée ligne par ligne, modifie chaque ligne selon des règles spécifiées dans un langage propre (appelé « script sed »), puis retourne le contenu du fichier (par défaut). Bien qu'originellement écrit pour Unix, par en 1973/1974 (Bell Labs), sed est maintenant disponible sur pratiquement tous les systèmes d'exploitation disposant d'une interface en ligne de commande.
Tiretvignette|Tirets typographiques. Le tiret est un signe de ponctuation. Il ne doit pas être confondu avec le trait d’union ni avec le signe moins. Il existe trois types de tirets, selon leur longueur : le tiret long (), le tiret moyen () et le tiret court (), ainsi que le double tiret. Le trait d'union ne peut être considéré comme un tiret. Il est aussi appelé “division” en typographie. Le tiret long ou « tiret cadratin » (« — » Unicode U+2014 HTML — — — digicode A-0151; TeX ---) a plusieurs fonctions.