Séance de cours

Structure du document : Décrire le contenu

Description

Cette séance de cours traite de la complexité de la description du contenu des documents et du développement de nouveaux standards ouverts au cours de la dernière décennie pour résoudre ce problème. Il explore lapproche de représentation réglementée pour créer des descriptions génériques de la structure de linformation de document, lextraction du contenu de document et la construction de modèles mondiaux. La séance de cours couvre également la structure générale du pipeline de documents, les défis de la modélisation de la structure et du contenu des documents, ainsi que le modèle dannotation ouverte et son modèle de données. Il explore les concepts de modélisation du contenu, des circulations, des dimensions et des paires homologues dans l'analyse de documents.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.