Publication

Multimodal feature extraction and fusion for audio-visual speech recognition

Related publications (58)

About
Privacy
Disclaimer

Graph Chatbot

Chat with Graph Search

Ask any question about EPFL courses, lectures, exercises, research, news, etc. or try the example questions below.

DISCLAIMER: The Graph Chatbot is not programmed to provide explicit or categorical answers to your questions. Rather, it transforms your questions into API requests that are distributed across the various IT services officially administered by EPFL. Its purpose is solely to collect and recommend relevant references to content that you can explore to help you answer your questions.

Multimodal feature extraction and fusion for audio-visual speech recognition

Graph Chatbot

Chat with Graph Search

Automatic social role recognition and its application in structuring multiparty interactions

Dynamic Classifier Fusion for Multi-sensory Activity Recognition

On dynamic stream weighting for Audio-Visual Speech Recognition

Integrating Posterior Features and Self-Organizing Maps for Isolated Word Recognition without Dynamic Programming

Audio-Visual Fusion

Small microphone array design and processing for speech recognition of vocal orders in restaurants.

Investigation of kNN Classifier on Posterior Features Towards Application in Automatic Speech Recognition

Semi-supervised Extraction of Audio-Visual Sources

Overcoming Asynchrony in Audio-Visual Speech Recognition

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams