Alphabet latinalt=|vignette|350x350px|Distribution de l'alphabet latin. L'alphabet latin' est un alphabet bicaméral comportant vingt-six lettres de base, principalement utilisé pour écrire les langues d’Europe de l'Ouest, d'Europe du Nord et d'Europe centrale, ainsi que les langues de nombreux pays qui ont été exposés à une forte influence européenne, notamment à travers la colonisation européenne des Amériques, de l'Afrique et de l'Océanie.
Caractères chinoisLes caractères chinois, ou sinogrammes, sont les unités logographiques qui composent l'écriture des langues chinoises. Ils sont appelés en chinois hànzì (« caractères han »), s'écrivant, en , et depuis le en République populaire de Chine, en Malaisie et à Singapour, en . Ils ont été dans le passé ou sont également de nos jours utilisés pour écrire d'autres langues, à titre principal ou complémentaire, notamment le coréen (hanja), le japonais (kanji) ou le vietnamien (chữ nho).
GraphèmeEn linguistique, un graphème est la plus petite entité d'un système d'écriture. C'est l’unité graphique correspondant en général à l'unité orale qu'est le phonème (contre-exemple en français le graphème complexe qui renvoie à deux phonèmes). Contrairement à l'unité « lettre », le graphème correspond ainsi mieux à la phonologie d'une langue. Cela est particulièrement visible dans le cas des graphèmes dits « complexes ». Les graphèmes peuvent se distinguer en deux sous-types : graphème simple : graphème composé d'une lettre ; graphème complexe : graphème composé de deux ou trois lettres.
SyllabaireUn syllabaire est un ensemble de symboles utilisés par une écriture syllabique pour représenter les sons vocalisés ou groupés d'une langue. Les symboles représentent des syllabes, à la différence des écritures alphabétiques où les symboles représentent des sons ou des phonèmes unitairement. La philologue Silvia Ferrara note que dans le langage, le son est émis naturellement sous forme de syllabes, si bien que les premières écritures s'organisent autour de la structure syllabique.
American Standard Code for Information InterchangeL'American Standard Code for Information Interchange (Code américain normalisé pour l'échange d'information), plus connu sous l'acronyme ASCII (, ), est une norme informatique de codage de caractères apparue dans les années 1960. C'est la norme de codage de caractères la plus influente à ce jour. ASCII définit 128 codes à 7 bits, comprenant 95 caractères imprimables : les chiffres arabes de 0 à 9, les 26 lettres de l'alphabet latin en minuscules et en capitales, des symboles mathématiques et de ponctuation.
World Wide Webvignette|Logo historique du World Wide Web par Robert Cailliau. vignette|Où la toile est née, plaque commémorant la création du World Wide Web dans les locaux du CERN. Le World Wide Web ( ; littéralement la « toile (d’araignée) mondiale », abrégé www ou le Web), la toile mondiale ou la toile, est un système hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles.
Hypertext Markup LanguageLe HyperText Markup Language, généralement abrégé HTML ou, dans sa dernière version, HTML5, est le langage de balisage conçu pour représenter les pages web. Ce langage permet d’écrire de l’hypertexte (d’où son nom), de structurer sémantiquement une page web, de mettre en forme du contenu, de créer des formulaires de saisie ou encore d’inclure des ressources multimédias dont des , des vidéos, et des programmes informatiques. L'HTML offre également la possibilité de créer des documents interopérables avec des équipements très variés et conformément aux exigences de l’accessibilité du web.
Écritures brahmiquesThe Brahmic scripts, also known as Indic scripts, are a family of abugida writing systems. They are used throughout the Indian subcontinent, Southeast Asia and parts of East Asia. They are descended from the Brahmi script of ancient India and are used by various languages in several language families in South, East and Southeast Asia: Indo-Aryan, Dravidian, Tibeto-Burman, Mongolic, Austroasiatic, Austronesian, and Tai. They were also the source of the dictionary order (gojūon) of Japanese kana.
LogogrammeUn logogramme (du grec ancien : , « parole », ici « mot », et , « caractère, lettre ») est un unique graphème notant un lemme (mot) entier et pas seulement une partie de ses phonèmes. Dans la majorité des cas, rien n'indique, dans un logogramme, comment il doit être prononcé (le signifiant en linguistique). En d'autres termes, c'est la plus petite unité significative du langage comme signe unique écrit qui représente un mot complet, indépendamment de la langue.
UTF-16UTF-16 est un codage des caractères définis par Unicode, où chaque caractère est codé sur une suite de un ou deux mots de 16 bits. Le codage était défini dans le rapport technique 17, annexé à la norme Unicode. Depuis, cette annexe est devenue obsolète car UTF-16 fait partie intégrante de la norme Unicode, dans son chapitre 3 Conformance, qui la définit de façon très stricte. L'UTF-16 ne doit pas être confondu avec l'UCS-2 qui est le codage, plus simple, de chaque caractère sur deux octets.