Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les concepts de réduction de la dimensionnalité, en se concentrant sur l'analyse en composantes principales (PCA) et l'analyse discriminante linéaire de Fisher (LDA). Il se penche également sur les méthodes de réduction des dimensions non linéaires comme Kernel PCA et t-SNE. La séance de cours passe ensuite au thème du clustering, expliquant le clustering de K-means et ses propriétés. Il explore en outre les modèles de mélange gaussien (GMM) et les techniques destimation de la densité non paramétrique comme les histogrammes et lestimation de la densité du noyau (KDE). L'algorithme de décalage moyen pour le regroupement est également discuté, en mettant l'accent sur son approche itérative pour trouver des maxima de densité. Des exemples et des visualisations du monde réel sont utilisés pour illustrer ces concepts.