Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'architecture des systèmes de récupération de texte, en se concentrant sur les techniques d'indexation telles que les fichiers inversés pour accélérer les tâches de recherche à terme. Il traite de l'organisation physique des fichiers inversés, de la construction d'index à l'aide de structures de données trie et de la mise en œuvre d'algorithmes map-reduce pour la récupération distribuée. L'instructeur explique le processus de fusion d'index, la compression d'index et l'utilisation de l'algorithme de Fagin pour la récupération de documents top-k. La séance de cours explore également l'algorithme de seuil pour la récupération distribuée et les applications des frameworks map-reduce dans diverses tâches de traitement de données.