Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours explore le processus de numérisation des documents historiques, en mettant l'accent sur la structure des pipelines, la modélisation des documents, l'extraction du contenu et les types de structures des documents. Elle se penche sur les défis de la description de la structure et du contenu des documents, en insistant sur la nécessité d'une normalisation. La séance de cours couvre également le modèle d'Annotation Ouverte et le modèle de Données de Toile partagée, soulignant leur rôle dans l'annotation et la description des ressources numériques en collaboration. En outre, il traite de l'application des réseaux neuraux dans la reconnaissance manuscrite du texte et la segmentation de l'image, montrant les progrès des techniques d'apprentissage automatique pour le traitement historique des documents.