Séance de cours

Kernel K-moyens de regroupement

Description

Cette séance de cours couvre l'algorithme Kernel K-means, une procédure itérative impliquant l'initialisation des clusters, l'attribution des points de données aux centroids, et les étapes de mise à jour des clusters jusqu'à la stabilité. Il explore l'influence des termes sur le regroupement à l'aide du noyau RBF, l'interprétation de la fonction objective et l'impact de la distribution des points de données sur les résultats du regroupement. La séance de cours traite également de l'interprétation de la solution, de la densité par rapport au nombre de points, et de l'effet des noyaux polynômes sur les limites de regroupement. Diverses méthodes de traitement des données manquantes, d'encodage des valeurs catégoriques et de traitement des ensembles de données déséquilibrés sont présentées, ainsi que des techniques comme l'échantillonnage en aval et le suréchantillonnage. L'importance de la sélection, du prétraitement et de la visualisation des ensembles de données est soulignée, avec des exemples provenant de différents domaines comme l'expression des gènes, l'ARN-Seq du cancer et les ensembles de données en ligne sur la vente au détail.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.