Langage naturelUn langage naturel, ou langage ordinaire, est une langue « normale » parlée par un être humain. Il s'oppose au langage formel, tel que le langage informatique, ainsi qu'aux langues construites. histoire des langues On désigne par langage naturel le langage parlé par les humains, apparu entre et avant notre ère.
Génération automatique de textesLa génération automatique de texte (GAT) est une sous discipline de la linguistique computationnelle qui vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte, une représentation formelle d'un contenu. Outre ses nombreuses applications existantes ou potentielles - par exemple pour produire automatiquement des bulletins météorologiques, ou des rapports automatisés - elle offre par ailleurs un cadre d'investigation des théories linguistiques, et particulièrement de ses mécanismes de production.
Langue SVOUne langue SVO est, en typologie syntaxique, une langue dont les phrases suivent généralement un ordre sujet-verbe-objet. Cet ordre est l'ordre le plus important pour ce qui est du nombre d'utilisateurs et le deuxième plus fréquent, représentant environ 42 % des langues, après SOV. Ces deux ordres représentant un total de 75 % des langues du monde. L’ordre SVO est le plus fréquent dans les langues indo-européennes et parmi les créoles. Le français est une langue du type SVO (« le chat (S) mange (V) la souris (O) ») ; néanmoins, cet ordre n’est pas toujours le seul possible.
Langue VOSIn linguistic typology, a verb–object–subject or verb–object–agent language, which is commonly abbreviated VOS or VOA, is one in which most sentences arrange their elements in that order. That would be the equivalent in English to "Drank cocktail Sam." The relatively rare default word order accounts for only 3% of the world's languages. It is the fourth-most common default word order among the world's languages out of the six.
GrammaticalitéLa grammaticalité est un concept formé au début des années 1960, qui désigne le caractère d'un énoncé conforme à la grammaire descriptive d'une langue. Son contraire est l’agrammaticalité. Pour Noam Chomsky, la notion de grammaticalité s'oppose à l'acceptabilité, cette dernière reposant sur le sentiment subjectif des locuteurs sur le caractère envisageable ou non d'une phrase.
Alternance codiqueL’alternance codique (de l'anglais code switching) désigne l’alternance entre plusieurs codes linguistiques (langues, dialectes ou registres de langue) au sein d’un même et unique discours ou énoncé, voire au sein d’une phrase, le plus souvent là où les syntaxes des deux codes s'alignent (Codique DGCP). On parle d’alternance codique seulement lorsqu’il est produit par des multilingues parlant couramment leurs langues.
Linguistic performanceThe term linguistic performance was used by Noam Chomsky in 1960 to describe "the actual use of language in concrete situations". It is used to describe both the production, sometimes called parole, as well as the comprehension of language. Performance is defined in opposition to "competence"; the latter describes the mental knowledge that a speaker or listener has of language. Part of the motivation for the distinction between performance and competence comes from speech errors: despite having a perfect understanding of the correct forms, a speaker of a language may unintentionally produce incorrect forms.
Sentence embeddingIn natural language processing, a sentence embedding refers to a numeric representation of a sentence in the form of a vector of real numbers which encodes meaningful semantic information. State of the art embeddings are based on the learned hidden layer representation of dedicated sentence transformer models. BERT pioneered an approach involving the use of a dedicated [CLS] token preprended to the beginning of each sentence inputted into the model; the final hidden state vector of this token encodes information about the sentence and can be fine-tuned for use in sentence classification tasks.