Cette séance de cours couvre l'architecture des systèmes de récupération de texte, en se concentrant sur les techniques d'indexation telles que les fichiers inversés pour accélérer les tâches de recherche à terme. Il traite de l'organisation physique des fichiers inversés, de la construction d'index à l'aide de structures de données trie et de la mise en œuvre d'algorithmes map-reduce pour la récupération distribuée. L'instructeur explique le processus de fusion d'index, la compression d'index et l'utilisation de l'algorithme de Fagin pour la récupération de documents top-k. La séance de cours explore également l'algorithme de seuil pour la récupération distribuée et les applications des frameworks map-reduce dans diverses tâches de traitement de données.