Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre Canonical Correlation Analysis (CCA), une méthode pour déterminer les caractéristiques dans des ensembles de données distinctes qui représentent conjointement les données bien. Il s'étend aux ensembles de données multimodaux tels que l'audio et les images, les données biométriques et le texte. La dérivation du CCA consiste à trouver des projections qui maximisent la corrélation, conduisant à un problème généralisé de valeur propre. Kernel CCA est introduit pour gérer les fonctionnalités non linéaires en utilisant les fonctions du noyau. La solution consiste à exprimer des vecteurs de projection sous la forme d'une combinaison linéaire de points de données dans l'espace des caractéristiques. La séance de cours traite également de l'interprétation des solutions de l'ACC, de la visualisation des vecteurs de projection et de l'application de l'ACC à de multiples modalités. Le CCA est comparé à l’analyse en composantes principales (APC), ce qui met en évidence sa capacité à découvrir des projections appropriées pour les données multimodales.