Cette séance de cours de l'instructeur couvre les concepts de regroupement et de classification, en se concentrant sur l'algorithme K-means. Il explique comment partitionner un ensemble de données en clusters en fonction de la similarité, des caractéristiques des méthodes de clustering, de l'algorithme K-means et de son application aux attributs catégoriels. La séance de cours discute également de la façon de choisir le nombre optimal de grappes et les avantages et les lacunes de K-moyens.