Synthèse vocaleLa synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.
Speech codingSpeech coding is an application of data compression to digital audio signals containing speech. Speech coding uses speech-specific parameter estimation using audio signal processing techniques to model the speech signal, combined with generic data compression algorithms to represent the resulting modeled parameters in a compact bitstream. Common applications of speech coding are mobile telephony and voice over IP (VoIP).
Linear predictive codingLinear predictive coding (LPC) is a method used mostly in audio signal processing and speech processing for representing the spectral envelope of a digital signal of speech in compressed form, using the information of a linear predictive model. LPC is the most widely used method in speech coding and speech synthesis. It is a powerful speech analysis technique, and a useful method for encoding good quality speech at a low bit rate.
Traitement de la paroleLe traitement de la parole est une discipline technologique dont l'objectif est la captation, la transmission, l'identification et la synthèse de la parole. Dans ce domaine, on peut définir la parole comme un texte oral. On s'intéresse à l'intelligibilité, c'est-à-dire à la possibilité, pour la personne qui écoute, de comprendre sans erreur le texte émis ; à l'amélioration de l'intelligibilité quand le signal est dégradé ; à l'identification de la personne qui parle ; à l'établissement automatique d'un texte écrit à partir de la parole ; à la synthèse de la parole à partir d'un texte écrit.
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Advanced Audio CodingAdvanced Audio Coding (AAC, « encodage audio avancé ») est un algorithme de compression audio avec perte de données ayant pour but d’offrir un meilleur rapport qualité sur débit binaire que le format plus ancien MPEG-1/2 Audio Layer 3, plus connu sous le nom de MP3. Pour ces qualités, il est choisi par différentes entreprises dont Apple ou RealNetworks. La RNT (Radio numérique terrestre utilise le système de radio diffusion DAB+ (version améliorée du DAB, Digital Audio Broadcasting) qui intègre une version avancée du codec AAC : HE-AAC version 2, aussi appelé eAAC+, et défini dans la norme MPEG-4 Part 3.
Linear predictionLinear prediction is a mathematical operation where future values of a discrete-time signal are estimated as a linear function of previous samples. In digital signal processing, linear prediction is often called linear predictive coding (LPC) and can thus be viewed as a subset of filter theory. In system analysis, a subfield of mathematics, linear prediction can be viewed as a part of mathematical modelling or optimization. The most common representation is where is the predicted signal value, the previous observed values, with , and the predictor coefficients.
SyllabeLa syllabe (du syllaba, du grec ancien : , « ensemble, rassemblement ») est une unité ininterrompue du langage oral. Son noyau, autour duquel elle se construit, est généralement une voyelle. Une syllabe peut également avoir des extrémités précédant ou suivant la voyelle, qui, lorsqu'elles existent, sont toujours constituées de consonnes. En linguistique, la syllabe est considérée comme une unité abstraite de la langue.
PhonétiqueLa phonétique est une branche de la linguistique qui étudie les phones (les sons) en tant que plus petits segments de la parole, du point de vue physique, physiologique, neurophysiologique et neuropsychologique, c’est-à-dire de leur production, transmission, audition et évolution dans le processus de communication humaine par la langue, en utilisant des moyens spécifiques pour leur description, classification et transcription. Certains auteurs incluent dans l’objet de la phonétique les traits suprasegmentaux de la parole (accent, intonation, etc.
Index of phonetics articlesAcoustic phonetics Active articulator Affricate Airstream mechanism Alexander John Ellis Alexander Melville Bell Alfred C. Gimson Allophone Alveolar approximant (ɹ) Alveolar click (ǃ) Alveolar consonant Alveolar ejective affricate (tsʼ) Alveolar ejective (tʼ) Alveolar ejective fricative (sʼ) Alveolar flap (ɾ) Alveolar lateral approximant (l, l̥) Alveolar lateral ejective affricate (tɬʼ) Alveolar lateral ejective fricative (ɬʼ) Alveolar lateral flap (ɺ) Alveolar nasal (n) Alveolar ridge Alveolar trill (r, r̥) Alveolo-palatal consonant Alveolo-palatal ejective fricative (ɕʼ) Apical consonant Approximant consonant Articulatory phonetics Aspirated consonant (◌h) Auditory phonetics Back vowel Basis of articulation Bernd J.