Reconnaissance d'entités nomméesLa reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des corpus documentaires. Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc. À titre d'exemple, on pourrait donner le texte qui suit, étiqueté par un système de reconnaissance d'entités nommées utilisé lors de la campagne d'évaluation MUC: Henri a acheté 300 actions de la société AMD en 2006 Henri a acheté 300 actions de la société AMD en 2006.
Origine du langageL’origine du langage humain a toujours suscité l’intérêt des penseurs. De nombreux mythes tendent à donner aux langues une origine surnaturelle. La Bible explique ainsi la multiplicité des langues par le mythe de la Tour de Babel, selon lequel la langue unique des origines aurait été divisée en une multitude de langues pour apporter la discorde entre les hommes et les empêcher de se concerter en vue d'une action commune.
Système de reconnaissance facialeUn système de reconnaissance faciale est une application logicielle visant à reconnaître automatiquement une personne grâce à son visage. Il s'agit d'un sujet particulièrement étudié en vision par ordinateur, avec de très nombreuses publications et brevets, et des conférences spécialisées. La reconnaissance de visage a de nombreuses applications en vidéosurveillance, biométrie, robotique, indexation d'images et de vidéos, , etc. Ces systèmes sont généralement utilisés à des fins de sécurité pour déverrouiller ordinateur/mobile/console, mais aussi en domotique.
Voyellethumb|right|400px|Sonagramme des voyelles [i], [u] (ou) et (â). En phonétique, on appelle voyelle un son du langage humain dont le mode de production est caractérisé par le libre passage de l'air dans les cavités situées au-dessus de la glotte, à savoir la cavité buccale et/ou les fosses nasales. Ces cavités servent de filtres dont la forme et la contribution relative à l'écoulement de l'air influent sur la qualité du son obtenu.
Language processing in the brainIn psycholinguistics, language processing refers to the way humans use words to communicate ideas and feelings, and how such communications are processed and understood. Language processing is considered to be a uniquely human ability that is not produced with the same grammatical understanding or systematicity in even human's closest primate relatives. Throughout the 20th century the dominant model for language processing in the brain was the Geschwind-Lichteim-Wernicke model, which is based primarily on the analysis of brain-damaged patients.
Consonne fricative glottale sourdeLa consonne fricative glottale sourde est un son consonantique assez fréquent dans de nombreuses langues parlées. Le symbole dans l'alphabet phonétique international est un h minuscule : . Quoique cette consonne ne soit pas spécifiquement une fricative, puisqu'elle n'est pas produite par le resserrement de la voie de phonation, on la considère généralement comme faisant partie de ce groupe pour des raisons historiques.
Phonétique acoustiqueLa phonétique acoustique est une partie de la linguistique qui a pour but de classer les sons en fonction de leur perception par le locuteur. On distingue deux sous-branches qui diffèrent selon la méthode adoptée : la phonétique auditive et la phonétique acoustique scientifique. La phonétique auditive propose un classement basé sur les impressions auditives provoquées par les sons du langage. Si elle ne parvient pas à un classement raisonné, elle marque néanmoins de manière durable la terminologie utilisée dans le classement articulatoire.
Compound probability distributionIn probability and statistics, a compound probability distribution (also known as a mixture distribution or contagious distribution) is the probability distribution that results from assuming that a random variable is distributed according to some parametrized distribution, with (some of) the parameters of that distribution themselves being random variables. If the parameter is a scale parameter, the resulting mixture is also called a scale mixture.
Quantification vectorielleLa quantification vectorielle est une technique de quantification souvent utilisée dans la compression de données avec pertes de données (Lossy Data Compression) pour laquelle l'idée de base est de coder ou de remplacer par une clé des valeurs d'un espace vectoriel multidimensionnel vers des valeurs d'un sous-espace discret de plus petite dimension. Le vecteur de plus petit espace nécessite moins d'espace de stockage et les données sont donc compressées.
SumérienLe sumérien (en sumérien EME.ĜIR15) est une langue morte qui était parlée dans l'Antiquité en Basse Mésopotamie. Elle est ainsi la langue parlée à Sumer aux Le sumérien comportait deux variétés (sociolectes) connues : l'émegir et l'émesal. Le sumérien est un isolat linguistique, c'est-à-dire qu'il n'a jamais pu être, jusqu'à aujourd'hui, rattaché à une famille de langues connue (comme d'autres langues au Proche-Orient ancien, telles que le hatti et l'élamite).