Traitement de texte: Humanités Informatique et Linguistique

Dans cours

DH-405: Foundations of digital humanities

This course gives an introduction to the fundamental concepts and methods of the Digital Humanities, both from a theoretical and applied point of view. The course introduces the Digital Humanities cir

Description

Cette séance de cours explore le domaine des humanités numériques, en se concentrant sur le traitement de grandes collections de textes numériques. Il se penche sur l’extraction de régularités et de structures cachées à partir d’objets textuels massifs, de modèles diachroniques et synchroniques et sur la reconstruction d’espaces de sens complexes. La séance de cours traite des origines et de la convergence de l'informatique en sciences humaines et de la linguistique computationnelle, en mettant l'accent sur les fondements formels des sciences humaines numériques. Il couvre également les défis posés par de très grands objets textuels, l'importance des pipelines de traitement de texte et la croissance des bases de données numériques de textes historiques. Divers projets et initiatives dans le domaine, tels que le projet Gutenberg et Wikisource, sont mis en évidence, ainsi que l'importance de la réutilisation du texte et de l'utilisation d'expressions régulières et de n-grammes dans l'analyse du texte.

Enseignant

Frédéric Kaplan

Source officielle