Cette séance de cours se penche sur l'exploration des archives historiques des journaux à l'aide du projet Impresso, en se concentrant sur l'évaluation de la qualité de l'OCR, le traitement des entités nommées, la modélisation des sujets et l'analyse de la réutilisation du texte. Il couvre les défis du prétraitement des données, de la recherche basée sur des entités nommées et de l'évaluation des interfaces numériques pour la recherche historique.