Modèle de mélangeIn statistics, a mixture model is a probabilistic model for representing the presence of subpopulations within an overall population, without requiring that an observed data set should identify the sub-population to which an individual observation belongs. Formally a mixture model corresponds to the mixture distribution that represents the probability distribution of observations in the overall population.
Variable latenteIn statistics, latent variables (from Latin: present participle of lateo, “lie hidden”) are variables that can only be inferred indirectly through a mathematical model from other observable variables that can be directly observed or measured. Such latent variable models are used in many disciplines, including political science, demography, engineering, medicine, ecology, physics, machine learning/artificial intelligence, bioinformatics, chemometrics, natural language processing, management, psychology and the social sciences.
Total inorganic carbonTotal inorganic carbon (CT or TIC) is the sum of the inorganic carbon species. Carbon compounds can be distinguished as either organic or inorganic, and dissolved or particulate, depending on their composition. Organic carbon forms the backbone of key components of organic compounds such as proteins, lipids, carbohydrates, and nucleic acids. Inorganic carbon is found primarily in simple compounds such as carbon dioxide (), carbonic acid (), bicarbonate (), and carbonate ().
Determining the number of clusters in a data setDetermining the number of clusters in a data set, a quantity often labelled k as in the k-means algorithm, is a frequent problem in data clustering, and is a distinct issue from the process of actually solving the clustering problem. For a certain class of clustering algorithms (in particular k-means, k-medoids and expectation–maximization algorithm), there is a parameter commonly referred to as k that specifies the number of clusters to detect.
Cycle du carbonevignette|redresse=2|Schéma du cycle du carbone : l'immense réservoir de carbone est la lithosphère qui stocke 80 000 000 Gigatonnes (Gt) de carbone minéral, sous forme de roches carbonatées et 14 000 Gt de carbone dans la matière organique fossile (réévaluation par rapport aux données du schéma). L'hydrosphère est un réservoir intermédiaire qui stocke 39 000 Gt de carbone sous forme de . L’atmosphère et la biosphère sont des petits réservoirs : le premier stocke 750 Gt principalement sous forme de , le second deux à trois fois plus selon les auteurs.
Modèle linéaire généraliséEn statistiques, le modèle linéaire généralisé (MLG) souvent connu sous les initiales anglaises GLM est une généralisation souple de la régression linéaire. Le GLM généralise la régression linéaire en permettant au modèle linéaire d'être relié à la variable réponse via une fonction lien et en autorisant l'amplitude de la variance de chaque mesure d'être une fonction de sa valeur prévue, en fonction de la loi choisie.
Linear least squaresLinear least squares (LLS) is the least squares approximation of linear functions to data. It is a set of formulations for solving statistical problems involved in linear regression, including variants for ordinary (unweighted), weighted, and generalized (correlated) residuals. Numerical methods for linear least squares include inverting the matrix of the normal equations and orthogonal decomposition methods. The three main linear least squares formulations are: Ordinary least squares (OLS) is the most common estimator.
Loi de Dirichletthumb|right|250px|Plusieurs images de la densité de la loi de Dirichlet lorsque K=3 pour différents vecteurs de paramètres α. Dans le sens horaire à partir du coin supérieur gauche : α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4). En probabilité et statistiques, la loi de Dirichlet, souvent notée Dir(α), est une famille de lois de probabilité continues pour des variables aléatoires multinomiales. Cette loi (ou encore distribution) est paramétrée par le vecteur α de nombres réels positifs et tire son nom de Johann Peter Gustav Lejeune Dirichlet.
Plate notationIn Bayesian inference, plate notation is a method of representing variables that repeat in a graphical model. Instead of drawing each repeated variable individually, a plate or rectangle is used to group variables into a subgraph that repeat together, and a number is drawn on the plate to represent the number of repetitions of the subgraph in the plate. The assumptions are that the subgraph is duplicated that many times, the variables in the subgraph are indexed by the repetition number, and any links that cross a plate boundary are replicated once for each subgraph repetition.
Histoire de la chimievignette|250px|Antoine Lavoisier, père de la chimie moderne. L'histoire de la chimie est intrinsèquement liée à la volonté de l'Homme de comprendre la nature et les propriétés de la matière, plus particulièrement la façon dont celle-ci existe ou se transforme. L'histoire de la chimie débute avec la découverte du feu qui est la première source d'énergie utilisée par l'homme pour améliorer son quotidien : éclairage, chauffage, cuisson des aliments, etc.