Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours présente l'indexation sémantique latente (LSI) en tant que méthode pour améliorer la récupération d'informations en cartographiant des documents et des requêtes dans un espace de concepts de dimensions inférieures, en abordant des problèmes tels que la synonymie et l'homonymie. L'instructeur explique l'idée clé de LSI, le processus de décomposition de la valeur singulière (SVD), et comment identifier les principaux concepts. À travers des exemples et des illustrations, la séance de cours couvre la construction et l'interprétation du SVD, le calcul de similarité dans l'espace conceptuel et la réponse aux requêtes en utilisant la similarité cosinus. La séance de cours se termine par des exemples pratiques d'application de LSI à des matrices de documents terminologiques et de mappage de requêtes dans l'espace conceptuel.