Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur GraphSearch.
Cette séance de cours couvre le processus de désambigation des entités, qui consiste à relier les mentions de texte dans un document à des entrées dans une base de connaissances. Il explore des techniques telles que la reconnaissance des entités désignées (NER) et l'algorithme Viterbi pour identifier et classer les entités. La séance de cours se penche sur les défis des homonymes et des synonymes dans l'appariement des entités, et l'utilisation de PageRank Personnalisé pour la désambituation. Il traite également de l'application des modèles de TPG pour l'appariement des entités, en soulignant l'importance de la conception rapide et de l'apprentissage en contexte. Les résultats de l'évaluation mettent en évidence l'efficacité d'invites spécifiques à un domaine et une formulation plus simple pour améliorer la précision de l'appariement des entités.