Se penche sur les techniques avancées de prétraitement des données, qui couvrent l'encodage catégorique, le traitement des données manquantes et les ensembles de données déséquilibrés, en mettant l'accent sur les mesures des performances et la comparaison des classificateurs.
Explore lutilisation des modèles de mélange gaussien pour la transition du clustering à la classification, couvrant la classification binaire, lestimation des paramètres et le classificateur Bayes optimal.