Couvre les bases de la récupération d'informations à l'aide de modèles d'espace vectoriel et d'exercices pratiques sur la rétroaction de pertinence et la numérisation de la liste de publication.
Introduit le traitement du langage naturel, qui couvre le prétraitement du texte, l'analyse des sentiments et l'analyse des sujets, en mettant l'accent sur l'établissement d'un indice de risque pour le changement climatique.
Explore la classification des données textuelles, en se concentrant sur des méthodes telles que les bayes naïques et les techniques de réduction de la dimensionnalité telles que l'analyse des composantes principales.
Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.
Couvre les défis et les opportunités de l'exploration de données, des questions pratiques, des composants d'algorithmes et des applications telles que l'analyse du panier d'achat.
Introduit l'apprentissage non supervisé en cluster avec les moyennes K et la réduction de dimensionnalité à l'aide de PCA, ainsi que des exemples pratiques.