Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'architecture des systèmes de récupération de texte, en se concentrant sur les techniques d'indexation pour une récupération efficace de l'information. Il explique le concept de fichiers inversés, abordant les positions des documents et des mots dans les documents. La séance de cours traite également de l'organisation physique des fichiers inversés, de la construction d'index et de la compression. Des exemples illustrent la construction et la recherche de fichiers inversés, ainsi que le modèle de programmation map-reduce pour la construction d'index à grande échelle. L'importance d'aborder la granularité et l'utilisation des essais dans la construction d'index sont également soulignées. Diverses applications de la réduction cartographique dans le traitement des données textuelles et Web sont explorées, ainsi que l'importance des affichages dans l'indexation.