Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre la méthode k-means du noyau, qui vise à éviter les solutions suboptimales en initialisant les centroïdes pour maximiser leur dispersion parmi les données. Il introduit le concept de noyaux pour décrire les données dans les espaces non euclides, permettant la formation de clusters non convexes. La séance de cours explique la dérivation de l'algorithme k-means du noyau, mettant en évidence le calcul des distances entre les observations et les centroïdes. Il traite également de l'application de machines vectorielles de soutien (SVM) à des problèmes non linéaires par redescription des données dans les espaces Hilbert. De plus, la séance de cours explore le regroupement par densité, en mettant l'accent sur l'identification des régions denses dans les ensembles de données sans étiquettes prédéfinies.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace