Sélection de caractéristiqueLa sélection de caractéristique (ou sélection d'attribut ou de variable) est un processus utilisé en apprentissage automatique et en traitement de données. Il consiste, étant donné des données dans un espace de grande dimension, à trouver un sous-sensemble de variables pertinentes. C'est-à-dire que l'on cherche à minimiser la perte d'information venant de la suppression de toutes les autres variables. C'est une méthode de réduction de la dimensionnalité. Extraction de caractéristique Catégorie:Apprentissage
Critère d'information bayésienLe critère d'information bayésien (en anglais bayesian information criterion, en abrégé BIC), aussi appelé critère d'information de Schwarz, est un critère d'information dérivé du critère d'information d'Akaike proposé par en 1978. À la différence du critère d'information d'Akaike, la pénalité dépend de la taille de l'échantillon et pas seulement du nombre de paramètres. Il s'écrit : avec la vraisemblance du modèle estimée, le nombre d'observations dans l'échantillon et le nombre de paramètres libres du modèle.
Langues nakho-daghestaniennesLes langues nakho-daghestaniennes (-daghestanaises, -daguestaniennes ou -daguestanaises) ou langues caucasiennes du nord-est forment la plus grande des trois familles de langues caucasiennes. Elles sont parlées dans les républiques d'Ingouchie, de Tchétchénie et du Daghestan, toutes situées dans le Sud de la fédération de Russie, ainsi qu'en Azerbaïdjan et en Géorgie.
Genre grammaticalEn linguistique, le genre grammatical est une caractéristique intrinsèque des noms qui influe sur la forme de certains éléments satellites. En tant que catégorie linguistique, il manifeste une classification des mots en tant qu’objets structurant la langue elle-même, par opposition à ce à quoi ces mots réfèrent. Elle fournit une distinction supplémentaire à celle du nombre grammatical, et en un sens se présente en rival au sein des langues indo-européennes à la classe nominale.
Langues baltesLes langues baltes forment une sous-branche des langues indo-européennes, relevant du groupe des langues balto-slaves, avec les langues slaves. Les linguistes ont éprouvé beaucoup de difficultés à établir la relation précise des langues baltes aux autres langues indo-européennes. Le regroupement balto-slave des langues baltes et des langues slaves est aujourd'hui largement accepté. Une minorité de chercheurs soutient que les langues baltiques forment une branche distincte.
Dyslexievignette|On parle de dyslexie pour distinguer le trouble de la lecture en général et plus récemment un trouble spécifique de l'apprentissage de la lecture qui tend à être rapporté à une cause physiologique. (Peinture d'Eduard Geselschap). La dyslexie est un trouble de la lecture et de l’écriture spécifique et durable qui apparaît chez l'enfant et l'adolescent (certains auteurs l'appellent aussi dyslexie développementale). Le trouble peut se traduire à des degrés divers par des difficultés à épeler les mots, lire vite, écrire, lire à haute voix ou bien comprendre ce qui est lu.
Inférence statistiquevignette|Illustration des 4 principales étapes de l'inférence statistique L'inférence statistique est l'ensemble des techniques permettant d'induire les caractéristiques d'un groupe général (la population) à partir de celles d'un groupe particulier (l'échantillon), en fournissant une mesure de la certitude de la prédiction : la probabilité d'erreur. Strictement, l'inférence s'applique à l'ensemble des membres (pris comme un tout) de la population représentée par l'échantillon, et non pas à tel ou tel membre particulier de cette population.
SumérienLe sumérien (en sumérien EME.ĜIR15) est une langue morte qui était parlée dans l'Antiquité en Basse Mésopotamie. Elle est ainsi la langue parlée à Sumer aux Le sumérien comportait deux variétés (sociolectes) connues : l'émegir et l'émesal. Le sumérien est un isolat linguistique, c'est-à-dire qu'il n'a jamais pu être, jusqu'à aujourd'hui, rattaché à une famille de langues connue (comme d'autres langues au Proche-Orient ancien, telles que le hatti et l'élamite).
Information de FisherEn statistique, l'information de Fisher quantifie l'information relative à un paramètre contenue dans une distribution. Elle est définie comme l'espérance de l'information observée, ou encore comme la variance de la fonction de score. Dans le cas multi-paramétrique, on parle de matrice d'information de Fisher. Elle a été introduite par R.A. Fisher. Soit f(x ; θ) la distribution de vraisemblance d'une variable aléatoire X (qui peut être multidimensionnelle), paramétrée par θ.
Alphabet phonétique internationalL'alphabet phonétique international (API) est un alphabet utilisé pour la transcription phonétique des sons du langage parlé. Contrairement aux nombreuses autres méthodes de transcription qui se limitent à des familles de langues, l'API est conçu pour couvrir l'ensemble des langues du monde. Développé par des phonéticiens français et britanniques sous les auspices de l'Association phonétique internationale, il a été publié pour la première fois en 1888.