PolysémieLa polysémie est la propriété d'un mot ou d'une expression d'avoir plusieurs sens ou significations différentes (on le qualifie de polysémique). Il ne faut pas confondre polysémie et homonymie. Deux mots homonymes ont la même forme (phonique ou graphique) mais sont des mots totalement différents, c'est-à-dire qu'ils n'ont pas la même étymologie. Ils ont deux entrées distinctes dans le dictionnaire. Polysémie et homonymie sont des cas particuliers d'ambiguïté.
Europarl CorpusThe Europarl Corpus is a corpus (set of documents) that consists of the proceedings of the European Parliament from 1996 to 2012. In its first release in 2001, it covered eleven official languages of the European Union (Danish, Dutch, English, Finnish, French, German, Greek, Italian, Portuguese, Spanish, and Swedish). With the political expansion of the EU the official languages of the ten new member states have been added to the corpus data.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Discours (linguistique)Le terme « discours » a son origine dans la rhétorique, mais a été adopté par la linguistique aussi. Selon certains linguistes, par discours on entend surtout une production orale. D’après d’autres, c’est un terme générique pour divers types de textes, par lequel ils entendent des productions soit écrites, soit orales. On trouve même le terme « texte » en tant que genre prochain dans la définition du discours. Discours En rhétorique, le discours est une série de développements oratoires destinés à persuader ou à émouvoir, structurés selon des règles précises.
Ordre des motsEn syntaxe, l’ordre des mots se réfère premièrement à la succession de ces unités dans le syntagme et des syntagmes dans la phrase simple, ainsi que dans la proposition faisant partie d’une phrase complexe. Dans un sens plus large, il concerne aussi l’ordre des propositions dans la phrase complexe. Certains auteurs mentionnent que, s’agissant de mots à fonction syntaxique, la question de leur ordre regarde non seulement la façon dont ils se succèdent, mais aussi la position plus ou moins éloignée des uns par rapport aux autres, l’ordre des mots ayant par conséquent une composante succession et une composante proximité/éloignement.
Paire minimaleEn phonologie, le terme paire minimale désigne deux éléments en opposition du point de vue phonologique. Selon l’une des définitions, les éléments en opposition sont des mots dont le sens est différencié par un seul phone ou par des éléments prosodiques portés par un phone. Dans une autre vision, les deux éléments en opposition sont des phones différenciés par un seul de leurs traits, par exemple sourde ↔ voisée, et ces éléments produisent des paires minimales de mots.
Speech translationSpeech translation is the process by which conversational spoken phrases are instantly translated and spoken aloud in a second language. This differs from phrase translation, which is where the system only translates a fixed and finite set of phrases that have been manually entered into the system. Speech translation technology enables speakers of different languages to communicate. It thus is of tremendous value for humankind in terms of science, cross-cultural exchange and global business.
Annotation sémantiqueL'annotation sémantique est l'opération consistant à relier le contenu d'un texte à des entités dans une ontologie. Par exemple, pour la phrase «Paris est la capitale de la France.», l'annotation correcte de Paris serait Paris et non Paris Hilton. L'annotation sémantique est une variante plus détaillée mais moins exacte de la méthode des entitiés nommées, car ces dernières décrivent seulement la catégorie de l'entité (Paris est une ville, sans la relier à la bonne page Wikipédia).
Mot composéEn linguistique, un mot composé est une juxtaposition de deux lexèmes libres permettant d'en former un troisième qui soit un lemme (« mot ») à part entière et dont le sens ne se laisse pas forcément deviner par celui des deux constituants. Ainsi, un garde-fou est, en français, un lemme indépendant de garde et de fou dont le sens de « balustrade de protection sur un pont, près d'un fossé, empêchant de tomber » ne peut être deviné.
Source textA source text is a text (sometimes oral) from which information or ideas are derived. In translation, a source text is the original text that is to be translated into another language. In historiography, distinctions are commonly made between three kinds of source texts: Primary source Primary sources are firsthand written accounts made at the time of an event by someone who was present. They have been described as those sources closest to the origin of the information or idea under study.