Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur GraphSearch.
We present a method that exploits an information theoretic framework to extract optimal audio features with respect to the video features. A simple measure of mutual information between the resulting audio features and the video ones allows to detect the active speaker among different candidates. The results show that our method is able to exploit the shared speech information contained in audio and video signals to recover their common source.
Chargement
Chargement
Chargement
Chargement
Chargement
Patricia Besson, Murat Kunt, Vlad Popovici, Jean-Philippe Thiran, Jean-Marc Vesin
Patricia Besson, Murat Kunt, Vlad Popovici, Jean-Philippe Thiran, Jean-Marc Vesin
Ivana Arsic de Heras Ciechomska, Ninoslav Marina, Jean-Philippe Thiran