LinguistiqueLa linguistique est une discipline scientifique s’intéressant à l’étude du langage. Elle n'est pas prescriptive mais descriptive. La prescription correspond à la norme, c'est-à-dire ce qui est jugé correct linguistiquement par les grammairiens. À l'inverse, la linguistique se contente de décrire la langue telle qu'elle est et non telle qu'elle devrait être. On trouve des témoignages de réflexions sur le langage dès l'Antiquité avec des philosophes comme Platon.
CorpusUn corpus est un ensemble de documents, artistiques ou non (textes, s, vidéos), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie La branche de la linguistique qui se préoccupe plus spécifiquement des corpus s'appelle logiquement la linguistique de corpus. Elle est liée au développement des systèmes informatiques, en particulier à la constitution de bases de données textuelles.
Lemme (linguistique)En linguistique, différents termes permettent de désigner les « entrées » d'un lexique d'une langue : item lexical, lemme, lexie ou unité lexicale. On peut les définir comme une chaîne de signes formant une unité sémantique et pouvant constituer une entrée de dictionnaire. Les signes les constituant peuvent être réalisés par des caractères, des sons, des gestes. Dans le vocabulaire courant, on parlera plus souvent de « mot », notion qui manque cependant de clarté. On construit des énoncés avec des lemmes ; les lemmes sont faits de morphèmes.
Concordance (livre)vignette|redresse=1|La Concordance biblique de , édition de 1734. Une concordance, dans son sens philologique, est un ouvrage qui donne pour chaque mot (souvent présenté dans l'ordre alphabétique) l'ensemble des passages d'un texte ou d'un ensemble de textes où il figure. L'établissement d'une concordance est un tel travail que seul un corpus important peut susciter ce genre d'investissement. Il existe des concordances de la Bible, du Coran ou d'ouvrages profanes d'auteurs célèbres.
Collocation (linguistique)Une collocation, en linguistique, est soit, de manière quantitative, le rapprochement fréquent de deux unités lexicales dans un corpus donné, soit, de façon qualitative, une combinaison d’unités lexicales qui exprime une idée précise. Ce rapprochement est directement encodé dans le lexique et relève donc du savoir lexical. Le terme « collocation » vient du latin collocare, qui signifie : « placer ensemble ». L'orateur Quintilien (35 / 95) emploie ce terme très général pour désigner l'« arrangement des mots ».
Nature (grammaire)En grammaire, la nature d'un mot regroupe un ensemble d'emplois linguistiques apparentés, permettant des substitutions de nature syntaxique. On peut dire également catégorie grammaticale (Lucien Tesnière) ou lexicale (Charles Bally), classe grammaticale (Jean Dubois), espèce grammaticale (Georges Galichet), ou encore partie du discours en grammaire traditionnelle. La nature d'un mot peut être un trait grammatical intrinsèque de ce mot.
Étiquetage morpho-syntaxiquevignette|C’est une image en language italien En linguistique, l'étiquetage morpho-syntaxique (aussi appelé étiquetage grammatical, POS tagging (part-of-speech tagging) en anglais) est le processus qui consiste à associer aux mots d'un texte les informations grammaticales correspondantes comme la partie du discours, le genre, le nombre, etc. à l'aide d'un outil informatique. Texte original : Nous sommes allées en Bretagne contempler de magnifiques allées couvertes du Néolithique.
Dictionnairethumb|upright=1.2|Dictionnaire en latin constitué de plusieurs volumes, œuvre d'Egidio Forcellini (1771). Un dictionnaire est un ouvrage de référence contenant un ensemble de mots d’une langue ou d’un domaine d’activité généralement présentés par ordre alphabétique et fournissant pour chacun une définition, une explication ou une correspondance (synonyme, antonyme, cooccurrence, traduction, étymologie). Le présent article concerne les dictionnaires unilingues qui décrivent ou normalisent une langue.
Linguistique informatiqueLa linguistique informatique est un champ interdisciplinaire basé sur une modélisation symbolique (à base de règles) ou statistique du langage naturel établie dans une perspective informatique. Les langues humaines sont des systèmes sémiotiques où tout se tient et dont le sens est négociable, ce qui permet leur évolution. Le langage est véhiculé par plusieurs modalités sensorielles : le son (la parole), les traces graphiques (l’écriture), les gestes (langue des signes, gestuelle co-verbale).
Traduction automatiqueLa traduction automatique désigne la traduction brute d'un texte entièrement réalisée par un ou plusieurs programmes informatiques. Dans le cas de la traduction d'une conversation audio, en direct ou en différé, on parle de transcription automatique. Un traducteur humain n’intervient pas pour corriger les erreurs du texte durant la traduction, mais seulement avant et/ou après. On la distingue de la traduction assistée par ordinateur où la traduction est en partie manuelle, éventuellement de façon interactive avec la machine.