Publication

A Spectrogram Model for Enhanced Source Localization and Noise-Robust ASR

Related publications (34)

About
Privacy
Disclaimer

Graph Chatbot

Chat with Graph Search

Ask any question about EPFL courses, lectures, exercises, research, news, etc. or try the example questions below.

DISCLAIMER: The Graph Chatbot is not programmed to provide explicit or categorical answers to your questions. Rather, it transforms your questions into API requests that are distributed across the various IT services officially administered by EPFL. Its purpose is solely to collect and recommend relevant references to content that you can explore to help you answer your questions.

A Spectrogram Model for Enhanced Source Localization and Noise-Robust ASR

Graph Chatbot

Chat with Graph Search

Two-level bimodal association for audio-visual speech recognition

Visual Speaker Localization Aided by Acoustic Models

Far-field Continuous Speech Recognition System based on Speaker Localization and Sub-band Beamformin

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Novel speech processing techniques for robust automatic speech recognition

Unsupervised Spectral Subtraction for Noise-Robust ASR on Unknown Transmission Channels

A Frequency-Domain Silence Noise Model

A Sector-Based, Frequency-Domain Approach to Detection and Localization of Multiple Speakers

The Multi-Channel Wall Street Journal Audio Visual Corpus (MC-WSJ-AV): Specification and Initial Experiments

Two-level bimodal association for audio-visual speech recognition

Visual Speaker Localization Aided by Acoustic Models

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Unsupervised Spectral Subtraction for Noise-Robust ASR on Unknown Transmission Channels

A Sector-Based, Frequency-Domain Approach to Detection and Localization of Multiple Speakers

The Multi-Channel Wall Street Journal Audio Visual Corpus (MC-WSJ-AV): Specification and Initial Experiments

Far-field Continuous Speech Recognition System based on Speaker Localization and Sub-band Beamformin

Novel speech processing techniques for robust automatic speech recognition

A Frequency-Domain Silence Noise Model