Explore l'organisation des fichiers, les formats d'enregistrement, les techniques d'indexation et les classifications d'index dans les bases de données, en soulignant l'importance d'un stockage et d'un accès efficaces aux données.
Explore les méthodes de clustering K-means et DBSCAN, en discutant des propriétés, des inconvénients, de l'initialisation et de la sélection optimale des clusters.
Introduit des méthodes de regroupement hiérarchique et k-means, en discutant des approches de construction, des fonctions de liaison, de la méthode de Ward, de l'algorithme Lloyd et de k-means++.
Couvre les techniques de réduction de dimensionnalité telles que PCA et LDA, les méthodes de clustering, l'estimation de la densité et la représentation des données.
Explore les règles de voisinage les plus proches, les défis de l'algorithme k-NN, le classificateur Bayes et l'algorithme k-means pour le regroupement.