Couvre les techniques de réduction de dimensionnalité telles que PCA et LDA, les méthodes de clustering, l'estimation de la densité et la représentation des données.
Introduit des méthodes de regroupement hiérarchique et k-means, en discutant des approches de construction, des fonctions de liaison, de la méthode de Ward, de l'algorithme Lloyd et de k-means++.
Couvre l'apprentissage non supervisé, en mettant l'accent sur la réduction de la dimensionnalité et le regroupement, en expliquant comment il aide à trouver des modèles dans les données sans étiquettes.
Explique le regroupement des moyennes k, en attribuant des points de données à des grappes en fonction de la proximité et en minimisant les distances carrées à l'intérieur des grappes.