Famille de languesUne famille de langues est un ensemble de langues apparentées qui ont évolué par transmission de génération en génération de locuteurs à partir d'une langue ancestrale commune. On parle de parenté généalogique ou génétique pour désigner ce type de relation ; le terme n'implique pas de parenté biologique entre les locuteurs des langues en question. La notion repose sur une analogie de l'évolution des langues avec celle des organismes vivants, selon le modèle de l'arbre généalogique.
Voyellethumb|right|400px|Sonagramme des voyelles [i], [u] (ou) et (â). En phonétique, on appelle voyelle un son du langage humain dont le mode de production est caractérisé par le libre passage de l'air dans les cavités situées au-dessus de la glotte, à savoir la cavité buccale et/ou les fosses nasales. Ces cavités servent de filtres dont la forme et la contribution relative à l'écoulement de l'air influent sur la qualité du son obtenu.
Ingénierie des caractéristiquesL'ingénierie des caractéristiques (en anglais feature engineering) a un rôle important, notamment dans l’analyse des données. Sans données, les algorithmes d’exploitation et d’apprentissage automatique de données ne seront pas en mesure de fonctionner. En effet, il s’avère qu’en réalité, on ne pourrait réaliser que peu de choses si nous ne disposions que de très peu de caractéristiques afin de pouvoir représenter les données, ou les banques de données, sous-jacentes.
Apprentissage superviséL'apprentissage supervisé (supervised learning en anglais) est une tâche d'apprentissage automatique consistant à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non supervisé. On distingue les problèmes de régression des problèmes de classement. Ainsi, on considère que les problèmes de prédiction d'une variable quantitative sont des problèmes de régression tandis que les problèmes de prédiction d'une variable qualitative sont des problèmes de classification.
Langues aborigènes d'AustralieLes langues aborigènes d'Australie regroupent de nombreuses familles de langues et isolats d'Australie et des îles alentour, exception faite de la Tasmanie. La plupart des langues aborigènes sont regroupées dans la famille des langues pama-nyungan, présente dans 90 % de l'Australie continentale. Les autres se répartissent en 27 autres familles, présentes seulement dans l'extrême nord. Ces langues, plusieurs centaines il y a trois siècles, sont pour la plupart disparues ou en voie de disparition.
ThaïLe thaï, plus anciennement appelé siamois ou thaï an un (autonyme : ภาษาไทย, phasa thai, ), est une langue du groupe taï de la famille des langues taï-kadaï. Il compte environ soixante millions de locuteurs. C'est la langue officielle de la Thaïlande et la langue de la littérature thaïlandaise. Le thaï appartient au groupe taï de la branche dite kam-taï de la famille des langues taï-kadaï. Certains linguistes cherchent à rapprocher la famille tai-kadai de celle des langues austronésiennes, en s'appuyant sur un fond de vocabulaire commun relatif à l'agriculture et à l'élevage.
Reconnaissance d'entités nomméesLa reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des corpus documentaires. Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc. À titre d'exemple, on pourrait donner le texte qui suit, étiqueté par un système de reconnaissance d'entités nommées utilisé lors de la campagne d'évaluation MUC: Henri a acheté 300 actions de la société AMD en 2006 Henri a acheté 300 actions de la société AMD en 2006.
Trainvignette|Un train de voyageurs en Croatie circulant sur une ligne non électrifiée. Le train est un matériel roulant ferroviaire assurant le transport de personnes ou de marchandises sur une ligne de chemin de fer. Par extension, on appelle train le service que constitue chacun de ces transports, réguliers ou non. Le train est un mode de transport, s'effectuant sur voie ferrée.
Sélection de caractéristiqueLa sélection de caractéristique (ou sélection d'attribut ou de variable) est un processus utilisé en apprentissage automatique et en traitement de données. Il consiste, étant donné des données dans un espace de grande dimension, à trouver un sous-sensemble de variables pertinentes. C'est-à-dire que l'on cherche à minimiser la perte d'information venant de la suppression de toutes les autres variables. C'est une méthode de réduction de la dimensionnalité. Extraction de caractéristique Catégorie:Apprentissage
Langues scandinavesdroite Europe germanic-languages 2.PNG droite Classification alternative des langues scandinaves|250px Nordiska språk.PNG Les langues scandinaves, ou langues germaniques septentrionales, sont un groupe de langues étroitement apparentées, essentiellement parlées dans les pays scandinaves. Elles forment une branche des langues germaniques, elles-mêmes sous-ensemble des langues indo-européennes. Les deux autres sous-familles germaniques sont les langues germaniques occidentales et les langues germaniques orientales, aujourd'hui éteintes.