Nuage de mots-clésvignette|Nuage de mots anglais liés au Web 2.0. vignette|Nuage de mots de causes du cancer. Le nuage de mots-clés, ou nuage de tags (en anglais tag cloud, word cloud ou keyword cloud) est une représentation visuelle des mots-clés (tags) les plus utilisés sur un site web. Généralement, les mots s'affichent dans des tailles et graisses de caractères d'autant plus visibles qu'ils sont utilisés ou populaires.
Gestion électronique des documentsLa gestion électronique des documents (GED ou en anglais DMS pour Document Management System ou EDM pour Electronic Document Management) désigne un logiciel informatisé visant à organiser et gérer des informations sous forme de documents électroniques au sein d'une organisation. Les logiciels de GED intègrent d'autres fonctionnalités permettant de faciliter voire d'automatiser la gestion des documents.
Partage de photographiesLe partage de photographies (ou « partage photo », angl. : « photo sharing ») consiste en la publication sur Internet de photographies de manière centralisée et partagée : un serveur sert à stocker et à afficher les images de nombreux utilisateurs, le site Web prenant alors la forme d'une grosse communauté. Un nombre important de sites grand public sont apparus, qui permettent ce partage avec des fonctionnalités et des modèles d'usage différents dans la façon d'organiser et de consulter ces images.
Modèle discriminatifDiscriminative models, also referred to as conditional models, are a class of logistical models used for classification or regression. They distinguish decision boundaries through observed data, such as pass/fail, win/lose, alive/dead or healthy/sick. Typical discriminative models include logistic regression (LR), conditional random fields (CRFs) (specified over an undirected graph), decision trees, and many others. Typical generative model approaches include naive Bayes classifiers, Gaussian mixture models, variational autoencoders, generative adversarial networks and others.
Couple (mathématiques)En mathématiques, un couple de deux objets est la donnée de ces deux objets dans un ordre déterminé. Le couple des deux objets et est noté . Si et sont distincts, le couple est distinct du couple ; en cela, la notion de couple se distingue de la notion de paire où l'ordre des éléments est indifférent. Pour désigner un couple, les anglophones emploient d'ailleurs ordered pair, c’est-à-dire paire ordonnée. Les objets a et b sont appelés respectivement première composante et deuxième composante du couple (a, b).
Probabilistic classificationIn machine learning, a probabilistic classifier is a classifier that is able to predict, given an observation of an input, a probability distribution over a set of classes, rather than only outputting the most likely class that the observation should belong to. Probabilistic classifiers provide classification that can be useful in its own right or when combining classifiers into ensembles. Formally, an "ordinary" classifier is some rule, or function, that assigns to a sample x a class label ŷ: The samples come from some set X (e.
Topic modelvignette|Visualisation du résumé d'un article scientifique traité par topic model. L'intensité de la couleur varie selon la probabilité d'appartenir au topic en question. En apprentissage automatique et en traitement automatique du langage naturel, un topic model (modèle thématique ou « modèle de sujet ») est un modèle probabiliste permettant de déterminer des sujets ou thèmes abstraits dans un document. Analyse sémantique latente (LSA) Allocation de Dirichlet latente (LDA) Analyse sémantique latente probab
Modèle génératifvignette|Schéma représentant la différence entre un modèle discriminatif et un modèle génératif. En classement automatique un modèle génératif est un modèle statistique défini par opposition à un modèle discriminatif. Étant donné une variable X à laquelle il doit associer une autre variable Y, le modèle génératif cherchera à décrire la probabilité conditionnelle ainsi que la probabilité puis d'utiliser la formule de Bayes pour calculer la probabilité .
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Modèle statistiqueUn modèle statistique est une description mathématique approximative du mécanisme qui a généré les observations, que l'on suppose être un processus stochastique et non un processus déterministe. Il s’exprime généralement à l’aide d’une famille de distributions (ensemble de distributions) et d’hypothèses sur les variables aléatoires X1, . . ., Xn. Chaque membre de la famille est une approximation possible de F : l’inférence consiste donc à déterminer le membre qui s’accorde le mieux avec les données.