Publication

Audio-Visual Fusion

Related publications (64)

About
Privacy
Disclaimer

Graph Chatbot

Chat with Graph Search

Ask any question about EPFL courses, lectures, exercises, research, news, etc. or try the example questions below.

DISCLAIMER: The Graph Chatbot is not programmed to provide explicit or categorical answers to your questions. Rather, it transforms your questions into API requests that are distributed across the various IT services officially administered by EPFL. Its purpose is solely to collect and recommend relevant references to content that you can explore to help you answer your questions.

Audio-Visual Fusion

Graph Chatbot

Chat with Graph Search

Audio-driven Nonlinear Video Diffusion

Unsupervised Extraction of Audio-Visual Objects

Semi-supervised Extraction of Audio-Visual Sources

Audio-based nonlinear video diffusion

Blind Audio-Visual Source Separation based on Sparse Redundant Representations

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Method and system for combining video sequences with spatio-temporal alignment

Method and system for combining video sequences with spatio-temporal alignment

Estimating Cohesion in Small Groups using Audio-Visual Nonverbal Behavior

Unsupervised Extraction of Audio-Visual Objects

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Estimating Cohesion in Small Groups using Audio-Visual Nonverbal Behavior

Audio-driven Nonlinear Video Diffusion

Audio-based nonlinear video diffusion

Semi-supervised Extraction of Audio-Visual Sources

Crossmodal Matching of Speakers using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams

Method and system for combining video sequences with spatio-temporal alignment

Method and system for combining video sequences with spatio-temporal alignment

Blind Audio-Visual Source Separation based on Sparse Redundant Representations