Publication

Unsupervised Spectral Substraction for Noise-Robust ASR

Hervé Bourlard, Guillaume Lathoud, Bertrand Mesot
2005
Rapport ou document de travail
Résumé

This paper proposes a simple, computationally efficient \mbox{2-mixture} model approach to discriminate between speech and background noise at the magnitude spectrogram level. It is directly derived from observations on real data, and can be used in a fully unsupervised manner, with the EM algorithm. In this paper, the 2-mixture model is used in an ``Unsupervised Spectral Substraction'' scheme that can be applied as a pre-processing step for any acoustic feature extraction scheme, such as MFCCs or PLP. The goal is to improve noise-robustness of the acoustic features. Experimental results on both OGINumbers95 and Aurora~2 tasks yielded a major improvement on all noise conditions, while retaining a similar performance on clean conditions.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Concepts associés (33)
Pollution sonore
thumb|Selon G. Dutilleux (2012), (ici, à titre d'exemple : vue de la circulation automobile urbaine à Bangkok, source majeure de nuisances sonores. thumb|L'échangeur de Daussoulx en Belgique ; autre exemple de source de nuisances sonores. La notion de pollution sonore regroupe généralement des nuisances sonores, et des pollutions induites par le son devenu dans certaines circonstances un « altéragène physique » pour l'être humain ou les écosystèmes.
Bruit de fond
En traitement du signal, on appelle bruit de fond toute composante non désirée affectant la sortie d'un dispositif indépendamment du signal présent à son entrée. Le bruit de fond se décompose en bruit propre, que cause le dispositif lui-même, et en perturbations originaires de l'extérieur qu'il capte malencontreusement. Au fur et à mesure que le signal se rapproche, puis s'enfonce en dessous du niveau du bruit de fond, la quantité d'informations qu'il peut transporter décroît , il devient plus difficile à détecter, et il finit par se dissoudre dans l'incertitude.
Bruit de mesure
En métrologie, le bruit de mesure est l'ensemble des signaux parasites qui se superposent au signal que l'on cherche à obtenir au moyen d'une mesure d'un phénomène physique. Ces signaux sont une gêne pour la compréhension de l'information que le signal transporte. La métrologie vise donc notamment à connaître leurs origines et à les caractériser, afin de les éliminer et d'obtenir le signal d'origine aussi distinctement que possible. La source du bruit d'origine externe est externe au système physique générant le signal utile et agit par influence sur celui-ci.
Afficher plus
Publications associées (34)

Toward plasma drifts in EMC3: Implementation of gradient, divergence, and particle tracing schemes

Matthieu Benoit C. Jacobs

This paper presents a first implementation of gradient, divergence, and particle tracing schemes for the EMC3 code, a stochastic 3D plasma fluid code widely employed for edge plasma and impurity transport modeling in tokamaks and stellarators. These scheme ...
Weinheim2024

Blind Universal Bayesian Image Denoising with Gaussian Noise Level Learning

Sabine Süsstrunk, Majed El Helou

Blind and universal image denoising consists of a unique model that denoises images with any level of noise. It is especially practical as noise levels do not need to be known when the model is developed or at test time. We propose a theoretically-grounded ...
2019

Noise Analysis For Environmental Loading Effect On Gps Position Time Series

Jean-Philippe Lucien Montillet, Feng Zhou

This paper focusses on the impact of environment mass loading on GPS time-series of position changes and noise characteristic. We make use of position time series of 206 GPS station ranging from 2001 to 2013 globally distributed. Firstly, we investigate th ...
Institute of Rock Structure and Mechanics, AS CR2017
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.