Étiquetage morpho-syntaxiquevignette|C’est une image en language italien En linguistique, l'étiquetage morpho-syntaxique (aussi appelé étiquetage grammatical, POS tagging (part-of-speech tagging) en anglais) est le processus qui consiste à associer aux mots d'un texte les informations grammaticales correspondantes comme la partie du discours, le genre, le nombre, etc. à l'aide d'un outil informatique. Texte original : Nous sommes allées en Bretagne contempler de magnifiques allées couvertes du Néolithique.
Génération automatique de textesLa génération automatique de texte (GAT) est une sous discipline de la linguistique computationnelle qui vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte, une représentation formelle d'un contenu. Outre ses nombreuses applications existantes ou potentielles - par exemple pour produire automatiquement des bulletins météorologiques, ou des rapports automatisés - elle offre par ailleurs un cadre d'investigation des théories linguistiques, et particulièrement de ses mécanismes de production.
Natural-language user interfaceNatural-language user interface (LUI or NLUI) is a type of computer human interface where linguistic phenomena such as verbs, phrases and clauses act as UI controls for creating, selecting and modifying data in software applications. In interface design, natural-language interfaces are sought after for their speed and ease of use, but most suffer the challenges to understanding wide varieties of ambiguous input. Natural-language interfaces are an active area of study in the field of natural-language processing and computational linguistics.
Texte massorétiqueLe texte massorétique (abrégé TM) est le texte biblique hébreu transmis par la Massorah, produit du travail des massorètes. Il trouve probablement son origine dans un texte dit « proto-massorétique » datant de la fin du , qui sert de base à de nombreuses traductions de la Bible. thumb|350px|Les principaux manuscrits du texte biblique d'après l'Encyclopaedia Biblica. Les lignes pointillées bleues indiquent les textes utilisés pour les modifications. MT = texte massorétique. LXX = version originale de la Septante.
Modèle de langageEn traitement automatique des langues, un modèle de langage ou modèle linguistique est un modèle statistique de la distribution de symboles distincts (lettres, phonèmes, mots) dans une langue naturelle. Un modèle de langage peut par exemple prédire le mot suivant dans une séquence de mots. Un modèle de langage n-gramme est un modèle de langage qui modélise des séquences de mots comme un processus de Markov. Il utilise l'hypothèse simplificatrice selon laquelle la probabilité du mot suivant dans une séquence ne dépend que d'une fenêtre de taille fixe de mots précédents.
Manuscrits bibliquesUn manuscrit biblique, ou pandecte, est la copie d'un texte fondateur des religions juive et chrétienne, écrit avant l'usage de l'imprimerie en Occident. Le mot manuscrit vient du latin , « main » et , « écrit » ; Bible vient du grec , « livres » par le latin chrétien , « livres sacrés » . La taille d'un manuscrit biblique varie du minuscule parchemin, contenant des versets individuels ou des écritures juives (voir téfiline), à d'énormes codex, comme des Bibles polyglottes.
Critique textuelleLa critique textuelle est une science, à l’intersection de l’histoire, de la philologie, de la critique littéraire et de la littérature, qui étudie la rédaction et les circonstances de rédaction, ainsi que la tradition de textes anciens jusqu’à nous. Discipline des , elle se distingue de la (étude critique d'un texte dans le but de connaître les différentes sources ayant permis à l'auteur de la composer ou, selon une définition plus extensive, examen de sources telles que des textes, des documents iconographiques ou épigraphiques).