Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours introduit les principes du regroupement dans l'apprentissage automatique, où les algorithmes regroupent les points de données sans connaître les véritables étiquettes ou le nombre de groupes. Le cluster est utilisé pour l'extraction des fonctionnalités et la compression des données, avec des prototypes de clusters représentant des points de données ou des centroïdes typiques. La séance de cours porte sur les mesures de similarité, la projection de l'APC et l'utilisation d'algorithmes K-means et soft-K-means. Il examine également l'impact de l'initialisation sur la performance des regroupements et évalue différentes méthodes de regroupement à l'aide de mesures internes et externes. L'instructeur montre comment déterminer le nombre optimal de grappes utilisant le RSS et explique la sensibilité des moyennes K à l'initialisation.