Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours se penche sur l'exploration des archives historiques des journaux à l'aide du projet Impresso, en se concentrant sur l'évaluation de la qualité de l'OCR, le traitement des entités nommées, la modélisation des sujets et l'analyse de la réutilisation du texte. Il couvre les défis du prétraitement des données, de la recherche basée sur des entités nommées et de l'évaluation des interfaces numériques pour la recherche historique.