NumérisationLa numérisation est la conversion des informations d'un support (texte, image, audio, vidéo) ou d'un signal électrique en données numériques que des dispositifs informatiques ou d'électronique numérique pourront traiter. Les données numériques se définissent comme une suite de caractères et de nombres qui représentent des informations. On utilise parfois le terme franglais digitalisation (digit signifiant chiffre en anglais). La numérisation, dans le contexte de l'administration des archives, est la conversion en masse des documents en fichiers informatiques.
Book scanningBook scanning or book digitization (also: magazine scanning or magazine digitization) is the process of converting physical books and magazines into digital media such as , electronic text, or electronic books (e-books) by using an . Large scale book scanning projects have made many books available online. Digital books can be easily distributed, reproduced, and read on-screen. Common file formats are DjVu, Portable Document Format (PDF), and (TIFF).
Bibliothèque numériqueUne bibliothèque numérique (virtuelle ou en ligne ou électronique) est une collection de documents (textes, images, sons) numériques (c'est-à-dire numérisés ou nés numériques) accessibles à distance (en particulier via Internet), proposant différentes modalités d'accès à l'information aux publics. Les documents peuvent être très élaborés, comme les livres numériques, ou beaucoup plus bruts. Elle peut aussi être définie comme un ensemble de collections mises en ligne pour un public précis.
Google LivresGoogle Livres, ou Google Books en anglais (anciennement Google Print), est un service en ligne de numérisation et de mise en ligne de livres fourni par Google. Lancé en , il dispose de moyens financiers et techniques considérables, et a vu son champ d'activité s'élargir progressivement. En 2017, c'est à la fois un outil de recherche intra-texte, de consultation de livres en ligne ou sur appareil mobile, de constitution de collections personnelles, et de téléchargement d'ouvrages libres de droits.
Édition numériquealt=Liseuse sur une pile de livre|vignette|311x311px|Liseuse sur une pile de livre L'édition numérique ou édition électronique est le processus à travers lequel des contenus sont produits, mis en forme et diffusés dans des environnements numériques (en ligne ou non) pour une lecture sur écran (ordinateur, liseuse, tablette, smartphone). L'édition numérique doit être comprise dans une continuité historique qui inclut aussi bien l'histoire de l'édition que, plus largement, l'histoire des idées et de leur diffusion.
Reconnaissance d'entités nomméesLa reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des corpus documentaires. Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc. À titre d'exemple, on pourrait donner le texte qui suit, étiqueté par un système de reconnaissance d'entités nommées utilisé lors de la campagne d'évaluation MUC: Henri a acheté 300 actions de la société AMD en 2006 Henri a acheté 300 actions de la société AMD en 2006.
Libre accès (édition scientifique)Le libre accès ou accès ouvert (en anglais : open access) est la mise à disposition en ligne de contenus numériques, qui peuvent eux-mêmes être soit libres (Creative Commons), soit sous un des régimes de propriété intellectuelle. Le libre accès est principalement utilisé pour les articles de revues de recherche universitaires sélectionnés par des pairs. On devrait, en réalité, distinguer le libre accès et l'accès ouvert (anglais : gratis open access), afin de distinguer plus nettement ce qui est, respectivement, en accès gratuit et libre, parce que soumis à une licence libre, et ce qui est « simplement » en accès gratuit pour l'internaute.
Archivage électroniqueLarchivage électronique désigne l'archivage à long terme de documents et données numériques. Les problématiques liées à la pérennisation des données numériques sont le coût et la durée de vie des supports, mais aussi l'accès au contenu malgré les avancées technologiques rendant les anciens supports obsolètes. L'archivage électronique commence dès la création des documents et permet à l'organisation productrice de l'information de les exploiter pour toute la durée de leur cycle de vie.
Annotation sémantiqueL'annotation sémantique est l'opération consistant à relier le contenu d'un texte à des entités dans une ontologie. Par exemple, pour la phrase «Paris est la capitale de la France.», l'annotation correcte de Paris serait Paris et non Paris Hilton. L'annotation sémantique est une variante plus détaillée mais moins exacte de la méthode des entitiés nommées, car ces dernières décrivent seulement la catégorie de l'entité (Paris est une ville, sans la relier à la bonne page Wikipédia).
Conservation des documentsLe principe de conservation des documents en archivistique ou en sciences de l'information et des bibliothèques est l'un des piliers essentiels de ces disciplines, avec la collecte des documents, le classement des archives ou les classifications décimales ou documentaires des bibliothèques ou centres de ressources. Les mesures appliquées par les bibliothécaires et les archivistes, notamment, pour conserver les documents (livres, archives, objets) ont pour but initial de leur assurer une « durée de vie » maximale.