PhonèmeEn phonologie, domaine de la linguistique, un phonème est la plus petite unité discrète (ou distinctive, c'est-à-dire permettant de distinguer des mots les uns des autres) que l'on puisse isoler par segmentation dans la chaîne parlée. Un phonème est en réalité une entité abstraite, qui peut correspondre à plusieurs sons. Il est en effet susceptible d'être prononcé de façon différente selon les locuteurs ou selon sa position et son environnement au sein du mot (voir allophone) : les phones sont les différentes réalisations d'un phonème.
GraphèmeEn linguistique, un graphème est la plus petite entité d'un système d'écriture. C'est l’unité graphique correspondant en général à l'unité orale qu'est le phonème (contre-exemple en français le graphème complexe qui renvoie à deux phonèmes). Contrairement à l'unité « lettre », le graphème correspond ainsi mieux à la phonologie d'une langue. Cela est particulièrement visible dans le cas des graphèmes dits « complexes ». Les graphèmes peuvent se distinguer en deux sous-types : graphème simple : graphème composé d'une lettre ; graphème complexe : graphème composé de deux ou trois lettres.
Phonemic orthographyA phonemic orthography is an orthography (system for writing a language) in which the graphemes (written symbols) correspond to the phonemes (significant spoken sounds) of the language. Natural languages rarely have perfectly phonemic orthographies; a high degree of grapheme–phoneme correspondence can be expected in orthographies based on alphabetic writing systems, but they differ in how complete this correspondence is.
Transparence orthographiqueLa transparence orthographique désigne, pour une langue donnée, le degré de correspondance entre l'orthographe et la phonologie de la langue, c'est-à-dire la correspondance entre la façon dont on écrit la langue et dont on la prononce. Une langue parfaitement transparente est une langue dans laquelle la correspondance entre graphèmes et phonèmes est consistante : à un phonème (plus petite unité prononçable d'un mot) correspond un et un seul graphème (lettre ou ensemble de lettres associés à un son de la langue, comme « a » ou « ch ») et réciproquement.
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Lexical Markup FrameworkLexical Markup Framework (LMF ou cadre de balisage lexical, en français) est le standard de l'Organisation internationale de normalisation (plus spécifiquement au sein de l'ISO/TC37) pour les lexiques du traitement automatique des langues (TAL). L'objectif est la normalisation des principes et méthodes relatifs aux ressources langagières dans le contexte de la communication multilingue et de la diversité culturelle.
Système d'écriturevignette|400px|Carte légendée des systèmes d'écriture dans le monde. Un système d’écriture est un ensemble organisé et plus ou moins standardisé de signes d'écriture permettant la communication des idées. En général, il s'agit de la transcription de la parole énoncée dans une langue parlée : on parle alors de glottographie. Il existe cependant des systèmes transmettant des idées sans l'intermédiaire direct de la parole : on parle alors de sémasiographie, que tous les spécialistes ne s'accordent cependant pas à considérer comme de véritables systèmes d'écriture ; on parle donc également de pré-écriture ou de proto-écriture.
Lexical resourceIn digital lexicography, natural language processing, and digital humanities, a lexical resource is a language resource consisting of data regarding the lexemes of the lexicon of one or more languages e.g., in the form of a database. Different standards for the machine-readable edition of lexical resources exist, e.g., Lexical Markup Framework (LMF) an ISO standard for encoding lexical resources, comprising an abstract data model and an XML serialization, and OntoLex-Lemon, an RDF vocabulary for publishing lexical resources as knowledge graphs on the web, e.
OrthographeEn linguistique, le terme orthographe (du latin orthographia, lui-même issu du grec , composé de , « droit, correct », et de , « écrire ») dénomme un système de règles concernant l'écriture d'une langue, faisant partie de son standard, en comparaison duquel on juge comme correctes ou incorrectes les formes que les utilisateurs réalisent en écrivant cette langue.
Allophone (phonologie)En linguistique, un allophone est l'une des réalisations sonores possibles d'un phonème. Contrairement à deux phonèmes entre eux, deux allophones d'un même phonème ne peuvent s'opposer en distinguant des unités de sens distincts dans une langue : les locuteurs leur attribuent le même rôle fonctionnel en phonologie, même quand ils perçoivent la différence phonétique entre les deux. Dans le texte qui suit, une forme entre crochets indique une transcription phonétique, tandis qu'une entre barres obliques indique une transcription phonologique.