TreebankIn linguistics, a treebank is a parsed text corpus that annotates syntactic or semantic sentence structure. The construction of parsed corpora in the early 1990s revolutionized computational linguistics, which benefitted from large-scale empirical data. The term treebank was coined by linguist Geoffrey Leech in the 1980s, by analogy to other repositories such as a seedbank or bloodbank. This is because both syntactic and semantic structure are commonly represented compositionally as a tree structure.
Mort d'une langueEn linguistique, la mort d'une langue survient quand disparaissent les d'une langue maternelle. Par extension, lextinction d'une langue est le stade où cette langue n'est plus connue, pas même comme langue seconde. D'autres termes proches sont le linguicide, c'est-à-dire la mort d'une langue pour des motifs naturels ou politiques et, plus rarement, la « glottophagie », phénomène où une langue peu parlée est absorbée ou remplacée par une autre, comptant des locuteurs plus nombreux.
Langage algébrique déterministeEn informatique théorique et en théorie des langages, un langage algébrique déterministe est un langage algébrique reconnu (par états finals) par un automate à pile déterministe. L'intérêt des langages déterministes est que leur analyse syntaxique se fait en temps linéaire en la longueur du mot, alors que dans un langage algébrique quelconque, la complexité est cubique, ou en tout cas se ramène à la complexité du produit matriciel, donc est en O(n2,37) où n est la longueur du mot par l'algorithme de Valiant.
Generative grammarGenerative grammar, or generativism ˈdʒɛnərətɪvɪzəm, is a linguistic theory that regards linguistics as the study of a hypothesised innate grammatical structure. It is a biological or biologistic modification of earlier structuralist theories of linguistics, deriving ultimately from glossematics. Generative grammar considers grammar as a system of rules that generates exactly those combinations of words that form grammatical sentences in a given language.
Categorial grammarCategorial grammar is a family of formalisms in natural language syntax that share the central assumption that syntactic constituents combine as functions and arguments. Categorial grammar posits a close relationship between the syntax and semantic composition, since it typically treats syntactic categories as corresponding to semantic types. Categorial grammars were developed in the 1930s by Kazimierz Ajdukiewicz and in the 1950s by Yehoshua Bar-Hillel and Joachim Lambek.
Arbre de la syntaxe abstraiteEn informatique, un arbre de la syntaxe abstraite ou ASA (abstract syntax tree, ou AST, en anglais) est un arbre dont les nœuds internes sont marqués par des opérateurs et dont les feuilles (ou nœuds externes) représentent les opérandes de ces opérateurs. Autrement dit, généralement, une feuille est une variable ou une constante. Un arbre de la syntaxe abstraite est utilisé par un analyseur syntaxique comme un intermédiaire entre un arbre d'analyse et une structure de données.
Sémantique générativeLa sémantique générative est le nom donné à un programme de recherche en linguistique initié par les travaux de plusieurs des premiers élèves de Noam Chomsky : John R. Ross, Paul Postal, et par la suite James McCawley. George Lakoff a aussi contribué au développement et à la promotion de la théorie. Cette approche s’est développée à partir de la grammaire générative et transformationnelle au milieu des années 1960, mais s’en démarquait en grande partie et allait à l’encontre des travaux de Noam Chomsky et des élèves à qui il enseigna plus tard.
Constituent (linguistics)In syntactic analysis, a constituent is a word or a group of words that function as a single unit within a hierarchical structure. The constituent structure of sentences is identified using tests for constituents. These tests apply to a portion of a sentence, and the results provide evidence about the constituent structure of the sentence. Many constituents are phrases. A phrase is a sequence of one or more words (in some theories two or more) built around a head lexical item and working as a unit within a sentence.
ActantEn grammaire, un actant (ou argument en grammaire générative) est un élément syntaxique nominal imposé par la valence de certaines classes lexicales : le verbe principalement, mais aussi le nom, l'adjectif, la préposition... Un actant se situe dans le schéma actanciel qui décrit l'organisation syntaxique nécessaire à certains mots dotés d'une valence afin qu'ils soient saturés. Ces termes doivent déterminer un procès, ou contenu sémantique du prédicat capable de transformer le thème, qu'il indique un processus (se reposer, travailler, tousser, etc.
Analyse lexicaleEn informatique, l’analyse lexicale, lexing, segmentation ou tokenization est la conversion d’une chaîne de caractères (un texte) en une liste de symboles (tokens en anglais). Elle fait partie de la première phase de la chaîne de compilation. Ces symboles sont ensuite consommés lors de l'analyse syntaxique. Un programme réalisant une analyse lexicale est appelé un analyseur lexical, tokenizer ou lexer. Un analyseur lexical est généralement combiné à un analyseur syntaxique pour analyser la syntaxe d'un texte.