Publication

Evaluation of Formant-Like Features for ASR

Concepts associés (31)
Speech coding
Speech coding is an application of data compression to digital audio signals containing speech. Speech coding uses speech-specific parameter estimation using audio signal processing techniques to model the speech signal, combined with generic data compression algorithms to represent the resulting modeled parameters in a compact bitstream. Common applications of speech coding are mobile telephony and voice over IP (VoIP).
Formant
On désigne par formant l'un des maxima d'énergie du spectre sonore d'un son de parole. Ce terme est notamment employé dans le domaine de la linguistique, de la phonétique et de l'acoustique. Il y a plusieurs définitions du mot « formant » (résonances du conduit vocal, pôles). vignette|Spectrogramme des voyelles [i, u, ɑ] en anglais américain, montrant les formants F1 et F2. Les formants peuvent être visualisés sur des spectres sonores. Ces spectres représentent la distribution en fréquences de l'énergie du signal de parole.
Iris de Fisher
thumb|Nuage de points du jeu de données Le jeu de données Iris connu aussi sous le nom de Iris de Fisher ou Iris d'Anderson est un jeu de données multivariées présenté en 1936 par Ronald Fisher dans son papier The use of multiple measurements in taxonomic problems comme un exemple d'application de l'analyse discriminante linéaire. Les données ont été collectées par Edgar Anderson afin de quantifier les variations de morphologie des fleurs d'iris de trois espèces. Deux des trois espèces ont été collectées en Gaspésie.
Speaker recognition
Speaker recognition is the identification of a person from characteristics of voices. It is used to answer the question "Who is speaking?" The term voice recognition can refer to speaker recognition or speech recognition. Speaker verification (also called speaker authentication) contrasts with identification, and speaker recognition differs from speaker diarisation (recognizing when the same speaker is speaking).
Mel-frequency cepstrum
In sound processing, the mel-frequency cepstrum (MFC) is a representation of the short-term power spectrum of a sound, based on a linear cosine transform of a log power spectrum on a nonlinear mel scale of frequency. Mel-frequency cepstral coefficients (MFCCs) are coefficients that collectively make up an MFC. They are derived from a type of cepstral representation of the audio clip (a nonlinear "spectrum-of-a-spectrum").
Fléau de la dimension
Le fléau de la dimension ou malédiction de la dimension (curse of dimensionality) est un terme inventé par Richard Bellman en 1961 pour désigner divers phénomènes qui ont lieu lorsque l'on cherche à analyser ou organiser des données dans des espaces de grande dimension alors qu'ils n'ont pas lieu dans des espaces de dimension moindre. Plusieurs domaines sont concernés et notamment l'apprentissage automatique, la fouille de données, les bases de données, l'analyse numérique ou encore l'échantillonnage.
Effet indésirable
Un effet indésirable d'un médicament ou d'un soin est un effet défavorable induit ou potentiellement induit par le traitement (gêne, allergie, complications graves, y compris le décès). Cet effet peut être immédiat ou différé. Selon la définition commune à l'OMS et à la Communauté européenne, on entend une . L'expression anglaise est Adverse Drug Reaction (ADR). Tous les types de traitements sont susceptibles d'entraîner des effets indésirables, qu'ils soient médicamenteux, mécaniques (plâtre par exemple), chirurgicaux ou même psychothérapeutiques.
Origine du langage
L’origine du langage humain a toujours suscité l’intérêt des penseurs. De nombreux mythes tendent à donner aux langues une origine surnaturelle. La Bible explique ainsi la multiplicité des langues par le mythe de la Tour de Babel, selon lequel la langue unique des origines aurait été divisée en une multitude de langues pour apporter la discorde entre les hommes et les empêcher de se concerter en vue d'une action commune.
Nonlinear dimensionality reduction
Nonlinear dimensionality reduction, also known as manifold learning, refers to various related techniques that aim to project high-dimensional data onto lower-dimensional latent manifolds, with the goal of either visualizing the data in the low-dimensional space, or learning the mapping (either from the high-dimensional space to the low-dimensional embedding or vice versa) itself. The techniques described below can be understood as generalizations of linear decomposition methods used for dimensionality reduction, such as singular value decomposition and principal component analysis.
Événement indésirable médicamenteux
L'événement indésirable médicamenteux (EIM), ou événement iatrogène médicamenteux, peut provenir d’un effet indésirable ou d’une erreur médicamenteuse. Les personnes âgées, une population plus fragile et plus touchée par la iatrogénèse, et en particulier médicamenteuse. L’URCAM de Poitou Charentes a fait une étude sur la population des personnes âgées, qui fait notamment apparaître que : sur les 719 dossiers examinés, sur une période de 5 jours, 90 hospitalisations soit 12,5 % ont été rapportées à un événement indésirable médicamenteux après analyse du Centre Régional de Pharmacovigilance (CRPV).

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.