PhonèmeEn phonologie, domaine de la linguistique, un phonème est la plus petite unité discrète (ou distinctive, c'est-à-dire permettant de distinguer des mots les uns des autres) que l'on puisse isoler par segmentation dans la chaîne parlée. Un phonème est en réalité une entité abstraite, qui peut correspondre à plusieurs sons. Il est en effet susceptible d'être prononcé de façon différente selon les locuteurs ou selon sa position et son environnement au sein du mot (voir allophone) : les phones sont les différentes réalisations d'un phonème.
GraphèmeEn linguistique, un graphème est la plus petite entité d'un système d'écriture. C'est l’unité graphique correspondant en général à l'unité orale qu'est le phonème (contre-exemple en français le graphème complexe qui renvoie à deux phonèmes). Contrairement à l'unité « lettre », le graphème correspond ainsi mieux à la phonologie d'une langue. Cela est particulièrement visible dans le cas des graphèmes dits « complexes ». Les graphèmes peuvent se distinguer en deux sous-types : graphème simple : graphème composé d'une lettre ; graphème complexe : graphème composé de deux ou trois lettres.
Phonemic orthographyA phonemic orthography is an orthography (system for writing a language) in which the graphemes (written symbols) correspond to the phonemes (significant spoken sounds) of the language. Natural languages rarely have perfectly phonemic orthographies; a high degree of grapheme–phoneme correspondence can be expected in orthographies based on alphabetic writing systems, but they differ in how complete this correspondence is.
Modèle de Markov cachéUn modèle de Markov caché (MMC, terme et définition normalisés par l’ISO/CÉI [ISO/IEC 2382-29:1999]) — (HMM)—, ou plus correctement (mais non employé) automate de Markov à états cachés, est un modèle statistique dans lequel le système modélisé est supposé être un processus markovien de paramètres inconnus. Contrairement à une chaîne de Markov classique, où les transitions prises sont inconnues de l'utilisateur mais où les états d'une exécution sont connus, dans un modèle de Markov caché, les états d'une exécution sont inconnus de l'utilisateur (seuls certains paramètres, comme la température, etc.
OrthographeEn linguistique, le terme orthographe (du latin orthographia, lui-même issu du grec , composé de , « droit, correct », et de , « écrire ») dénomme un système de règles concernant l'écriture d'une langue, faisant partie de son standard, en comparaison duquel on juge comme correctes ou incorrectes les formes que les utilisateurs réalisent en écrivant cette langue.
Transparence orthographiqueLa transparence orthographique désigne, pour une langue donnée, le degré de correspondance entre l'orthographe et la phonologie de la langue, c'est-à-dire la correspondance entre la façon dont on écrit la langue et dont on la prononce. Une langue parfaitement transparente est une langue dans laquelle la correspondance entre graphèmes et phonèmes est consistante : à un phonème (plus petite unité prononçable d'un mot) correspond un et un seul graphème (lettre ou ensemble de lettres associés à un son de la langue, comme « a » ou « ch ») et réciproquement.
Synthèse vocaleLa synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Orthographic transcriptionOrthographic transcription is a transcription method that employs the standard spelling system of each target language. Examples of orthographic transcription are "Pushkin" and "Pouchkine", respectively the English and French orthographic transcriptions of the surname "Пу́шкин" in the name Алекса́ндр Пу́шкин (Alexander Pushkin). Thus, each target language (English and French) transcribes the surname according to its own orthography. Contrast with phonetic transcription, phonemic orthography, transliteration, and translation.
Transcription phonétiqueUne transcription phonétique est une méthode de transcription plus ou moins formalisée des sons d'une ou plusieurs langues. Cette transcription rend normalement une approximation de la prononciation standard de la langue. Les variantes dialectales et individuelles sont difficiles à rendre dans la transcription. Les variantes d'un même phonème (allophone) sont presque toujours impossibles à rendre. Quelques signes sont à disposition pour rendre les informations paraverbales (pauses, racler, tousser, rire...