Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.
Introduit la classification des documents en utilisant des fonctionnalités telles que les mots et les métadonnées, et des modèles tels que k-Nearest-Neighbors et word embeddings.
Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.