Publication

A Spectrogram Model for Enhanced Source Localization and Noise-Robust ASR

Publications associées (34)

À propos
Confidentialité
Mentions légales

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

A Spectrogram Model for Enhanced Source Localization and Noise-Robust ASR

Graph Chatbot

Chattez avec Graph Search

Two-level bimodal association for audio-visual speech recognition

Visual Speaker Localization Aided by Acoustic Models

Far-field Continuous Speech Recognition System based on Speaker Localization and Sub-band Beamformin

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Novel speech processing techniques for robust automatic speech recognition

Unsupervised Spectral Subtraction for Noise-Robust ASR on Unknown Transmission Channels

A Frequency-Domain Silence Noise Model

A Sector-Based, Frequency-Domain Approach to Detection and Localization of Multiple Speakers

The Multi-Channel Wall Street Journal Audio Visual Corpus (MC-WSJ-AV): Specification and Initial Experiments

Unsupervised Spectral Subtraction for Noise-Robust ASR on Unknown Transmission Channels

Novel speech processing techniques for robust automatic speech recognition

A Sector-Based, Frequency-Domain Approach to Detection and Localization of Multiple Speakers

Visual Speaker Localization Aided by Acoustic Models

The Multi-Channel Wall Street Journal Audio Visual Corpus (MC-WSJ-AV): Specification and Initial Experiments

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction

Far-field Continuous Speech Recognition System based on Speaker Localization and Sub-band Beamformin

A Frequency-Domain Silence Noise Model

Two-level bimodal association for audio-visual speech recognition

Recognition Of Reverberant Speech Using Frequency Domain Linear Prediction