Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les concepts d'analyse en composantes principales (PCA) et d'analyse discriminante linéaire (LDA) pour la réduction de la dimensionnalité. En commençant par l'intuition derrière PCA, il explique comment PCA vise à conserver un signal important tout en éliminant le bruit. La séance de cours se penche ensuite sur les détails mathématiques de la PCA, y compris la maximisation de la variance et les problèmes de vecteurs propres. Passant à LDA, il discute de l'objectif de regrouper des échantillons de la même classe et de séparer différentes classes. La séance de cours se termine par une comparaison du Kernel PCA et du PCA traditionnel, soulignant les avantages du Kernel PCA pour les données non linéaires. En outre, il introduit l'intégration de voisins stochastiques distribués en t (t-SNE) en tant que technique populaire pour visualiser des données de grande dimension.