Publication

Investigating the use of Visual Focus of Attention for Audio-Visual Speaker Diarisation

Publications associées (33)

À propos
Confidentialité
Mentions légales

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Investigating the use of Visual Focus of Attention for Audio-Visual Speaker Diarisation

Graph Chatbot

Chattez avec Graph Search

Wearable systems for audio, visual and gaze monitoring

Nonretinotopic Exogenous Attention

Semi-supervised Extraction of Audio-Visual Sources

Method and Device for Removing Echo in an Audio Signal

Blind Audio-Visual Source Separation based on Sparse Redundant Representations

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

MULTI-MODAL SPEAKER DIARIZATION OF REAL-WORLD MEETINGS USING COMPRESSED-DOMAIN VIDEO FEATURES

Method And Device For Removing Echo In A Multi-Channel Audio Signal

Integrating audio and vision for robust automatic gender recognition

Nonretinotopic Exogenous Attention

Blind Audio-Visual Source Separation based on Sparse Redundant Representations

Wearable systems for audio, visual and gaze monitoring

Semi-supervised Extraction of Audio-Visual Sources

Method and Device for Removing Echo in an Audio Signal

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

MULTI-MODAL SPEAKER DIARIZATION OF REAL-WORLD MEETINGS USING COMPRESSED-DOMAIN VIDEO FEATURES

Method And Device For Removing Echo In A Multi-Channel Audio Signal

Integrating audio and vision for robust automatic gender recognition