Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours traite de la complexité de la description du contenu des documents et du développement de nouveaux standards ouverts au cours de la dernière décennie pour résoudre ce problème. Il explore lapproche de représentation réglementée pour créer des descriptions génériques de la structure de linformation de document, lextraction du contenu de document et la construction de modèles mondiaux. La séance de cours couvre également la structure générale du pipeline de documents, les défis de la modélisation de la structure et du contenu des documents, ainsi que le modèle dannotation ouverte et son modèle de données. Il explore les concepts de modélisation du contenu, des circulations, des dimensions et des paires homologues dans l'analyse de documents.