Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Synthèse vocaleLa synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.
Intonation prosodiqueEn prosodie, le terme « intonation » a plusieurs acceptions. Certaines diffèrent par la nature du segment de la chaîne parlée auquel elles se réfèrent. Dans un sens large, l’intonation concerne le niveau de hauteur du phone (c’est-à-dire du son au sens phonétique) ou la variation de cette hauteur dans le noyau de la syllabe, ayant une fonction sémantique au niveau du mot, ainsi que la variation de la hauteur des phones au niveau de segments plus grands que le mot, c’est-à-dire le syntagme, la phrase simple, la proposition et la phrase complexe.
Grammaire de constructionLa grammaire de construction (souvent abrégée CxG pour l'anglais Construction Grammar) est une famille de théories sociobiologiques dans le domaine de la linguistique cognitive et évolutive. Ceux-ci supposent que le langage humain est constitué de constructions ou d'appariements appris de formes linguistiques avec des significations. Les constructions correspondent à des réplicateurs ou des mêmes dans la mémétique et d'autres théories de réplicateurs culturels.
Régression logistiqueEn statistiques, la régression logistique ou modèle logit est un modèle de régression binomiale. Comme pour tous les modèles de régression binomiale, il s'agit d'expliquer au mieux une variable binaire (la présence ou l'absence d'une caractéristique donnée) par des observations réelles nombreuses, grâce à un modèle mathématique. En d'autres termes d'associer une variable aléatoire de Bernoulli (génériquement notée ) à un vecteur de variables aléatoires . La régression logistique constitue un cas particulier de modèle linéaire généralisé.
Prosodie (linguistique)En linguistique, le terme prosodie (du latin prosodia, à son tour du grec ancien prosōidía « chant pour accompagner la lyre ; variation de hauteur de la voix »), tel qu’il est entendu en français, dénomme la branche de la phonétique et de la phonologie qui étudie ce qu’on appelle les « traits prosodiques » de la langue, nommés aussi « traits suprasegmentaux ». Ce sont principalement l’accent, le ton, l’intonation, la jointure, la pause, le rythme, le tempo et le débit. Le terme français a plusieurs correspondants en anglais.
Phonologievignette|alt=Nikolai Trubetzkoy, 1920s |Nikolai Trubetzkoy, linguiste russe connu pour ses travaux dans le domaine de la phonologie. Photo prise vers 1920. La phonologie est la branche de la linguistique qui étudie l'organisation des sons du langage au sein des différentes langues naturelles. Elle est complémentaire de la phonétique, qui s'intéresse à ces sons eux-mêmes, indépendamment de leur emploi. La phonétique s’intéresse aux sons en tant qu’unités acoustiques produites par un mécanisme physiologique (phones) ; la phonologie, aux sons en tant qu’éléments d’un système (phonèmes).
Emotional prosodyEmotional prosody or affective prosody is the various non-verbal aspects of language that allow people to convey or understand emotion. It includes an individual's tone of voice in speech that is conveyed through changes in pitch, loudness, timbre, speech rate, and pauses. It can be isolated from semantic information, and interacts with verbal content (e.g. sarcasm). Emotional prosody in speech is perceived or decoded slightly worse than facial expressions but accuracy varies with emotions.
Classification naïve bayésiennevignette|Exemple de classification naïve bayésienne pour un ensemble de données dont le nombre augmente avec le temps. La classification naïve bayésienne est un type de classification bayésienne probabiliste simple basée sur le théorème de Bayes avec une forte indépendance (dite naïve) des hypothèses. Elle met en œuvre un classifieur bayésien naïf, ou classifieur naïf de Bayes, appartenant à la famille des classifieurs linéaires. Un terme plus approprié pour le modèle probabiliste sous-jacent pourrait être « modèle à caractéristiques statistiquement indépendantes ».
Multinomial logistic regressionIn statistics, multinomial logistic regression is a classification method that generalizes logistic regression to multiclass problems, i.e. with more than two possible discrete outcomes. That is, it is a model that is used to predict the probabilities of the different possible outcomes of a categorically distributed dependent variable, given a set of independent variables (which may be real-valued, binary-valued, categorical-valued, etc.).