Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
il est conseillé de joindre à tout document ou fichier électronique une carte d’identité dans laquelle seront recensés les paramètres essentiels à son identification et au traçage de l’information qui y est contenue. Ces informations sur les ressources documentaires sont appelées des métadonnées (du grec meta : second, au-delà, de nature plus élevée et fondamentale) et forment un ensemble structuré d’informations décrivant une ressource qui soit l’accompagne, soit y est directement intégré (encapsulage). Ces informations sur l’information se retrouvent, par exemple, dans les notices bibliographiques des catalogues de bibliothèques qui nous renseignent sur la nature de l’information contenue dans le document catalogué et se traduisent par des données univoques telles que l’auteur, le titre, le sujet, etc., facilement identifiables par l’utilisateur. Les Bibliothèques fortes de leur expérience dans le traitement de l’information ont désiré apporter à la communauté Internet leur savoir-faire dans ce domaine en proposant une indexation plus fine que celle déjà générée par les balises des documents html, mais il n’était pas question de proposer à des non-spécialistes une structuration aussi développée et complexe que, par exemple, le format MARC21 qui est utilisé pour le catalogage professionnel. Cela aurait été un frein au but visé : un emploi simple, souple et le plus largement répandu possible. Ainsi, un standard de métadonnées consensuel a été développé depuis 1995 en collaboration entre l’OCLC (Online Computer Library Center) et le NCSA (National Center for Supercomputing Applications) à Dublin (Ohio). Ce standard est appelé le Dublin Core, core utilisé pour signifier ici l’aspect central, le noyau des métadonnées minimales sans lesquelles l’information ne peut pas être considérée comme exploitable. Le Dublin Core se veut international et extensible. Il cherche à couvrir les besoins des disciplines spécialisées dans la gestion de l’information. Depuis 2003, il est devenu une norme ISO et présente un intérêt certain de par sa simplicité et son applicabilité dans tous les formats de fichiers (utilisable avec HTML et XML). Le standard DC est en outre le format minimum de l’Open Archives Initiative (OAI) qui permet, via l’interopérabilité des serveurs, l’exposition et la récolte de métadonnées.