Cette séance de cours couvre l'importance de la collecte et de la préparation des données dans le contexte de la méthodologie de classification, en mettant l'accent sur les étapes impliquées telles que l'identification des caractéristiques, l'étiquetage, la discrétisation, la sélection et la normalisation. L'instructeur discute des défis des données d'étiquetage, des différents types de fonctionnalités et des méthodes pour obtenir des étiquettes, y compris le crowdsourcing. Divers algorithmes d'agrégation pour la gestion des réponses des travailleurs de la foule sont également expliqués.