Couvre les bases de la récupération d'informations à l'aide de modèles d'espace vectoriel et d'exercices pratiques sur la rétroaction de pertinence et la numérisation de la liste de publication.
Introduit les bases de la recherche de l'information, couvrant la recherche par texte et booléen, la recherche de l'espace vectoriel et le calcul de la similitude.
Couvre la récupération d'informations probabilistes, la pertinence de la modélisation en tant que probabilité, l'expansion des requêtes et la génération automatique de thésaurus.
Présente les bases de la récupération d'informations, couvrant la représentation de documents, l'expansion des requêtes et TF-IDF pour le classement des documents.
Présente les bases du traitement de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets.
Introduit des modèles Booléen et Vector Space pour la recherche d'informations, couvrant la syntaxe, le calcul de similarité, la fréquence des termes et les poids des requêtes.
Explore les techniques d'indexation, les fichiers inversés, les modèles map-reduce et l'utilisation de trie pour une récupération d'informations efficace.
Explore les techniques d'indexation, les fichiers inversés, les algorithmes de réduction de carte et les méthodes de récupération de documents haut de gamme dans les systèmes de récupération de texte.
Explore le traitement des données texte, en dérivant des ensembles de données propres à partir de textes non structurés, et diverses techniques d'analyse de texte.