Langues romanesLes langues romanes, aussi appelées langues latines ou encore langues néo-latines, sont un groupe de langues issues du latin vulgaire, plus précisément du latin véhiculaire. Utilisés pour la communication sur toute l'étendue de l'Empire romain, le latin véhiculaire a évolué en plusieurs langues romanes dont trois : le castillan, le français et le portugais, ont connu une expansion mondiale à partir du . La distinction entre langue et dialecte étant assez arbitraire, on peut définir d'une vingtaine à une cinquantaine de langues romanes.
Garden-path sentenceA garden-path sentence is a grammatically correct sentence that starts in such a way that a reader's most likely interpretation will be incorrect; the reader is lured into a parse that turns out to be a dead end or yields a clearly unintended meaning. "Garden path" refers to the saying "to be led down [or up] the garden path", meaning to be deceived, tricked, or seduced. In A Dictionary of Modern English Usage (1926), Fowler describes such sentences as unwittingly laying a "false scent".
Opinion miningEn informatique, l'opinion mining (aussi appelé sentiment analysis) est l'analyse des sentiments à partir de sources textuelles dématérialisées sur de grandes quantités de données (big data). Ce procédé apparait au début des années 2000 et connait un succès grandissant dû à l'abondance de données provenant de réseaux sociaux, notamment celles fournies par Twitter. L'objectif de l’opinion mining est d'analyser une grande quantité de données afin d'en déduire les différents sentiments qui y sont exprimés.
Industrie langagièreL’industrie langagière est le secteur d’activité destiné à faciliter la communication multilingue, à l’oral comme à l’écrit. Selon la Direction générale de la traduction de la Commission européenne, l’industrie langagière englobe les activités de traduction, d’interprétariat, de sous-titrage ainsi que le doublage, l’internationalisation de logiciels et de sites web, le développement d’outils technologiques linguistiques, l’organisation de conférences internationales, l’enseignement des langues et l'expertise linguistique.
LangageLe langage est la capacité d'exprimer une pensée et de communiquer au moyen d'un système de signes (vocaux, gestuel, graphiques, tactiles, olfactifs, etc.) doté d'une sémantique, et le plus souvent d'une syntaxe — mais ce n'est pas systématique (la cartographie est un exemple de langage non syntaxique). Fruit d'une acquisition, la langue est une des nombreuses manifestations du langage. Les langages sont constitués de signaux correspondant au support physique de l'information.
Interlingual machine translationInterlingual machine translation is one of the classic approaches to machine translation. In this approach, the source language, i.e. the text to be translated is transformed into an interlingua, i.e., an abstract language-independent representation. The target language is then generated from the interlingua. Within the rule-based machine translation paradigm, the interlingual approach is an alternative to the direct approach and the transfer approach. In the direct approach, words are translated directly without passing through an additional representation.
Plongement lexicalLe plongement lexical (« word embedding » en anglais) est une méthode d'apprentissage d'une représentation de mots utilisée notamment en traitement automatique des langues. Le terme devrait plutôt être rendu par vectorisation de mots pour correspondre plus proprement à cette méthode. Cette technique permet de représenter chaque mot d'un dictionnaire par un vecteur de nombres réels. Cette nouvelle représentation a ceci de particulier que les mots apparaissant dans des contextes similaires possèdent des vecteurs correspondants qui sont relativement proches.
Langues berbèresvignette|Drapeau berbère. Les langues berbères ou le tamazight, ou encore le berbère, en berbère (néo-tifinagh : ber-Tfng ; tifinagh touareg : ber-Tfng ; ABL : ber-Latn), forment une branche de la famille des langues chamito-sémitiques (ou afro-asiatiques, ou afrasiennes) et couvrent une vaste aire géographique : l’Afrique du Nord depuis le Maroc jusqu’à l’Égypte, en passant par l’Algérie, la Tunisie et la Libye, ainsi qu'une partie du Sahara, et la partie ouest du Sahel (Mauritanie, Mali et Niger).
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Word-sense inductionIn computational linguistics, word-sense induction (WSI) or discrimination is an open problem of natural language processing, which concerns the automatic identification of the senses of a word (i.e. meanings). Given that the output of word-sense induction is a set of senses for the target word (sense inventory), this task is strictly related to that of word-sense disambiguation (WSD), which relies on a predefined sense inventory and aims to solve the ambiguity of words in context.