Publication

Multimodal feature extraction and fusion for audio-visual speech recognition

Publications associées (58)

À propos
Confidentialité
Mentions légales

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Multimodal feature extraction and fusion for audio-visual speech recognition

Graph Chatbot

Chattez avec Graph Search

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Class-specific classifiers in audio-visual speech recognition

Audio-visual reliability estimates using stream entropy for speech recognition

Information theoretic feature extraction for audio-visual speech recognition

Multimodal Speaker Localization from Omnidirectional Videos

A comparative study of two state-of-the-art sequence processing techniques for hand gesture recognition

MULTI-MODAL SPEAKER DIARIZATION OF REAL-WORLD MEETINGS USING COMPRESSED-DOMAIN VIDEO FEATURES

Using entropy as a stream reliability estimate for audio-visual speech recognition

Acoustic models for posterior features in speech recognition

Acoustic Models for Posterior Features in Speech Recognition