Couvre la recherche de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés.
Couvre l'inférence statistique, l'apprentissage automatique, les SVM pour la classification des pourriels, le prétraitement des courriels et l'extraction des fonctionnalités.
Il s'agit de numériser les documents historiques, de normaliser la structure des documents et d'appliquer les réseaux neuraux à la reconnaissance du texte et à la segmentation de l'image.
Couvre les concepts de base de la récupération d'informations textuelles et la façon dont les documents sont indexés et récupérés en fonction des requêtes des utilisateurs.
Explore la règle discriminatoire gaussienne pour la classification à l'aide de modèles de mélange gaussien et discute des limites de dessin et de la complexité du modèle.