Allocation de Dirichlet latenteDans le domaine du traitement automatique des langues, l’allocation de Dirichlet latente (de l’anglais Latent Dirichlet Allocation) ou LDA est un modèle génératif probabiliste permettant d’expliquer des ensembles d’observations, par le moyen de groupes non observés, eux-mêmes définis par des similarités de données. Par exemple, si les observations () sont les mots collectés dans un ensemble de documents textuels (), le modèle LDA suppose que chaque document () est un mélange () d’un petit nombre de sujets ou thèmes ( topics), et que la génération de chaque occurrence d’un mot () est attribuable (probabilité) à l’un des thèmes () du document.
Topic modelvignette|Visualisation du résumé d'un article scientifique traité par topic model. L'intensité de la couleur varie selon la probabilité d'appartenir au topic en question. En apprentissage automatique et en traitement automatique du langage naturel, un topic model (modèle thématique ou « modèle de sujet ») est un modèle probabiliste permettant de déterminer des sujets ou thèmes abstraits dans un document. Analyse sémantique latente (LSA) Allocation de Dirichlet latente (LDA) Analyse sémantique latente probab
Comportement socialvignette|Un comportement social : une pour entrer dans un bus. À Addis-Abeba, Éthiopie, janvier 2018. vignette|Les spectateuris serrés sur un banc public pour mieux regarder le défilé militaire du 14 Juillet se redressent pour éviter de se géner et restent vigilants les uns les unes. Juillet 2006. Le comportement social se distingue de l'instinct, en ce qu'il est appris lors des interactions sociales, ou de la socialisation. Les sciences sociales étudient les comportements sociaux, qui sont une sous-catégorie des comportements humains.
Dirichlet-multinomial distributionIn probability theory and statistics, the Dirichlet-multinomial distribution is a family of discrete multivariate probability distributions on a finite support of non-negative integers. It is also called the Dirichlet compound multinomial distribution (DCM) or multivariate Pólya distribution (after George Pólya). It is a compound probability distribution, where a probability vector p is drawn from a Dirichlet distribution with parameter vector , and an observation drawn from a multinomial distribution with probability vector p and number of trials n.
Analyse sémantique latente probabilisteL’analyse sémantique latente probabiliste (de l'anglais, Probabilistic latent semantic analysis : PLSA), aussi appelée indexation sémantique latente probabiliste (PLSI), est une méthode de traitement automatique des langues inspirée de l'analyse sémantique latente. Elle améliore cette dernière en incluant un modèle statistique particulier. La PLSA possède des applications dans le filtrage et la recherche d'information, le traitement des langues naturelles, l'apprentissage automatique et les domaines associés.
Communication non verbaleLa communication non verbale (ou langage du corps) désigne tout échange n'ayant pas recours à la parole. Elle ne repose pas sur les mots (pratiques linguistiques), mais sur plusieurs champs extralinguistiques correspondant à des signaux sociaux ou catégories fonctionnelles, objets d'études de différentes disciplines : communication para-verbale (communication vocale comprenant les traits prosodiques, les onomatopées, le rire, la toux, et parfois distinguée de la communication non verbale) analysée par la , gestes (mouvements du corps, gestuelle, actions et réactions) et expressions faciales (dont les micro-expressions) étudiés par la kinésique et la gestique, contact visuel et rôle du regard (clin d'œil complice, regard désapprobateur ou sceptique.
Loi de Dirichletthumb|right|250px|Plusieurs images de la densité de la loi de Dirichlet lorsque K=3 pour différents vecteurs de paramètres α. Dans le sens horaire à partir du coin supérieur gauche : α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4). En probabilité et statistiques, la loi de Dirichlet, souvent notée Dir(α), est une famille de lois de probabilité continues pour des variables aléatoires multinomiales. Cette loi (ou encore distribution) est paramétrée par le vecteur α de nombres réels positifs et tire son nom de Johann Peter Gustav Lejeune Dirichlet.
Plate notationIn Bayesian inference, plate notation is a method of representing variables that repeat in a graphical model. Instead of drawing each repeated variable individually, a plate or rectangle is used to group variables into a subgraph that repeat together, and a number is drawn on the plate to represent the number of repetitions of the subgraph in the plate. The assumptions are that the subgraph is duplicated that many times, the variables in the subgraph are indexed by the repetition number, and any links that cross a plate boundary are replicated once for each subgraph repetition.
Relation humainevignette|Relation humaine. Une relation humaine implique au moins deux êtres humains et est souvent décrite via des aspects différents, si l'on s'intéresse à la nature de la relation ou si l'on s'intéresse aux personnes en relation. Plusieurs disciplines universitaires travaillent à l'analyser. Certaines étudient régulièrement les questions que pose la société contemporaine : la psychologie, les sciences de la communication, la sociologie ; d'autres se placent dans la perspective de l'anthropologie, de la sémiotique ou allient les deux comme l'anthroposémiotique.
Modèle de mélangeIn statistics, a mixture model is a probabilistic model for representing the presence of subpopulations within an overall population, without requiring that an observed data set should identify the sub-population to which an individual observation belongs. Formally a mixture model corresponds to the mixture distribution that represents the probability distribution of observations in the overall population.