Cette séance de cours introduit le concept de clustering, qui regroupe des points de données similaires en clusters. Il explique comment le clustering peut être utilisé pour l'extraction de fonctionnalités et la compression de données, et discute de l'importance de la similarité intra-cluster et inter-cluster. La séance de cours couvre également le rôle de l'information préalable dans le regroupement, l'impact des valeurs aberrantes et différentes mesures de similarité telles que la norme L1 et la norme L2. En outre, il explore la forme des amas générés par les techniques de regroupement, en distinguant les amas non globulaires des amas globulaires.