Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les algorithmes de clusters visant à optimiser les critères d'homogénéité et de séparabilité, y compris les clusters hiérarchiques, les clusters à base de centroïdes et les clusters à base de densité. Il explique les méthodes de construction du cluster hiérarchique, telles que les approches agglomératives et divisives, en mettant l'accent sur le cluster agglomératif. La séance de cours traite également des fonctions de liaison comme la liaison unique, complète, moyenne et centroïde pour assurer la séparation des clusters. Il explore la méthode de regroupement de Ward pour l'homogénéité et la méthode k-means comme une alternative à l'exploration de toutes les partitions possibles. La séance de cours détaille l'algorithme Lloyd pour les moyennes k, en discutant de la convergence, du coût de calcul et de la formation de clusters. Il introduit également l'algorithme k-means++ pour atténuer les solutions suboptimales dues à l'initialisation aléatoire.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace