Séance de cours

Indexation pour la récupération d'informations

Description

Cette séance de cours couvre l'architecture des systèmes de récupération de texte, en se concentrant sur les techniques d'indexation pour une récupération efficace de l'information. Il explique le concept de fichiers inversés, abordant les positions des documents et des mots dans les documents. La séance de cours traite également de l'organisation physique des fichiers inversés, de la construction d'index et de la compression. Des exemples illustrent la construction et la recherche de fichiers inversés, ainsi que le modèle de programmation map-reduce pour la construction d'index à grande échelle. L'importance d'aborder la granularité et l'utilisation des essais dans la construction d'index sont également soulignées. Diverses applications de la réduction cartographique dans le traitement des données textuelles et Web sont explorées, ainsi que l'importance des affichages dans l'indexation.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.