Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Basaltethumb|Lave en coussins de basalte vu au fond de l'océan, au niveau de Hawaï. Le basalte est une roche magmatique volcanique issue d'un magma refroidi rapidement et caractérisée par sa composition minéralogique : plagioclases (50 %), de pyroxènes (25 à 40 %), d'olivine (10 à 25 %), et de 2 à 3 % de magnétite. Sur Terre, il a une origine volcanique et est un des constituants principaux de la croûte océanique. Sur la Lune, il constitue la surface des mers lunaires. Ce serait un constituant important des croûtes de Mars, Vénus et Mercure.
Suite (mathématiques)vignette|Exemple de suite : les points bleus représentent ses termes. En mathématiques, une suite est une famille d'éléments — appelés ses « termes » — indexée par les entiers naturels. Une suite finie est une famille indexée par les entiers strictement positifs inférieurs ou égaux à un certain entier, ce dernier étant appelé « longueur » de la suite. Lorsque tous les éléments d'une suite (infinie) appartiennent à un même ensemble , cette suite peut être assimilée à une application de dans .
Bétonthumb|Aspect hétérogène de la surface d'un béton de ciment, appelé communément béton, et constitué de ciment, d'eau et de granulats fins (sable) et grossiers (graviers). Le béton est un assemblage de matériaux de nature généralement minérale. Il met en présence des matières inertes, appelées granulats ou agrégats (graviers, gravillons, sables), et un liant (ciment, bitume, argile), c'est-à-dire une matière susceptible d'en agglomérer d'autres ainsi que des adjuvants qui modifient les propriétés physiques et chimiques du mélange.
Cimentvignette|Du ciment, fourni en sac, prêt à être mélangé avec de l’eau et des granulats. Le ciment est un liant hydraulique (qui durcit sous l'action de l'eau), utilisé dans la préparation du béton, et aujourd'hui le plus souvent employé dans la confection des dallages, des parpaings, des enduits et des mortiers. Le principe est de chauffer à très haute température du calcaire et de l'argile pour former des nodules de silicates de calcium, le clinker. Ceux-ci sont ensuite broyés finement.
Corrélation de SpearmanEn statistique, la corrélation de Spearman ou rho de Spearman, nommée d'après Charles Spearman (1863-1945) et souvent notée par la lettre grecque (rho) ou est une mesure de dépendance statistique non paramétrique entre deux variables. La corrélation de Spearman est étudiée lorsque deux variables statistiques semblent corrélées sans que la relation entre les deux variables soit de type affine. Elle consiste à trouver un coefficient de corrélation, non pas entre les valeurs prises par les deux variables mais entre les rangs de ces valeurs.
GrenatGrenat désigne une famille de minéraux du groupe des nésosilicates cristallisant dans le système cristallin cubique (ou isométrique). Les grenats de qualité gemme sont des pierres fines. Employé seul, le terme grenat est quasi synonyme de pyrope-almandin. La plupart des grenats sont en effet de composition intermédiaire (solution solide) entre ces deux espèces (pôles purs). Une roche formée presque exclusivement de grenat est appelée une grenatite.
Corrélation croiséeLa corrélation croisée est parfois utilisée en statistique pour désigner la covariance des vecteurs aléatoires X et Y, afin de distinguer ce concept de la « covariance » d'un vecteur aléatoire, laquelle est comprise comme étant la matrice de covariance des coordonnées du vecteur. En traitement du signal, la corrélation croisée (aussi appelée covariance croisée) est la mesure de la similitude entre deux signaux.
Distance correlationIn statistics and in probability theory, distance correlation or distance covariance is a measure of dependence between two paired random vectors of arbitrary, not necessarily equal, dimension. The population distance correlation coefficient is zero if and only if the random vectors are independent. Thus, distance correlation measures both linear and nonlinear association between two random variables or random vectors. This is in contrast to Pearson's correlation, which can only detect linear association between two random variables.
Data dredgingvignette|Exemple de Data dredging. Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui . Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking).