Publication

Multimodal feature extraction and fusion for audio-visual speech recognition

Related publications (58)

About
Privacy
Disclaimer

Graph Chatbot

Chat with Graph Search

Ask any question about EPFL courses, lectures, exercises, research, news, etc. or try the example questions below.

DISCLAIMER: The Graph Chatbot is not programmed to provide explicit or categorical answers to your questions. Rather, it transforms your questions into API requests that are distributed across the various IT services officially administered by EPFL. Its purpose is solely to collect and recommend relevant references to content that you can explore to help you answer your questions.

Multimodal feature extraction and fusion for audio-visual speech recognition

Graph Chatbot

Chat with Graph Search

Acoustic Models for Posterior Features in Speech Recognition

Visual feature analysis for audio-visual speech recognition

A collaborative approach to image segmentation and behavior recognition from image sequences

Machine Learning for Multimodal Interaction IV

Probabilistic models for multi-classifier biometric authentication using quality measures

Hierarchical Integration of Phonetic and Lexical Knowledge in Phone Posterior Estimation

In-Context Phone Posteriors as Complementary Features for Tandem ASR

A multimodal pattern recognition framework for speaker detection

Relevant Feature Selection for Audio-Visual Speech Recognition

Low-Dimensional Motion Features for Audio-Visual Speech Recognition