Résumé
La linguistique de corpus est une branche de la linguistique qui étudie le langage à travers des exemples contenus dans des textes réels. En particulier elle se propose d'extraire d'un corpus les connaissances linguistiques essentielles à l’enseignement des langues et à l'élaboration des dictionnaires. La linguistique de corpus situe la signification dans le discours et dans l'interaction entre les gens plutôt que dans l'esprit des locuteurs. En effet le sens des mots est déterminé par le contexte dans lequel ils sont employés. Aujourd'hui la création de ces corpus linguistiques est possible grâce au processus automatique c'est-à-dire grâce à l'emploi d'outils statistiques et de programmes informatiques qui rendent le travail humain beaucoup plus facile. Concernant la valeur de l'annotation de corpus, il existe deux points de vue différents, l'un de John Sinclair, qui préfère l'annotation minimale afin que les textes puissent parler pour "eux-mêmes", l'autre de l'équipe Survey of English Usage qui préconise l'annotation comme une compréhension linguistique plus efficace. L'expression est une traduction de l'anglais Corpus Linguistics car c'est à partir du monde anglophone que l'étude de cette discipline commence à se développer dans le domaine linguistique. Si la linguistique est une discipline scientifique consacrée à l'étude du langage, le corpus représente son objet principal. Dans la tradition, la notion de corpus est définie de manière canonique, dans les domaines religieux, juridiques et littéraires. Elle a été élaborée par des disciplines comme la philologie et l’herméneutique qui concernent le domaine des traitements automatiques du langage. Cette conception canonique de corpus comme « sac des mots « aujourd'hui est remplacée par une notion qui considère le corpus comme un ensemble de textes oraux ou écrits et pas seulement un ensemble de mots ou des phrases qui ne sont pas liés à un certain contexte. Certains affirment que la naissance de la linguistique de corpus peut être associée à la création en 1755 du Johnson, le premier dictionnaire de la langue anglaise basé sur un corpus.
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.