Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
K-moyennesLe partitionnement en k-moyennes (ou k-means en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire. Étant donnés des points et un entier k, le problème est de diviser les points en k groupes, souvent appelés clusters, de façon à minimiser une certaine fonction. On considère la distance d'un point à la moyenne des points de son cluster ; la fonction à minimiser est la somme des carrés de ces distances.
Determining the number of clusters in a data setDetermining the number of clusters in a data set, a quantity often labelled k as in the k-means algorithm, is a frequent problem in data clustering, and is a distinct issue from the process of actually solving the clustering problem. For a certain class of clustering algorithms (in particular k-means, k-medoids and expectation–maximization algorithm), there is a parameter commonly referred to as k that specifies the number of clusters to detect.
Correlation clusteringClustering is the problem of partitioning data points into groups based on their similarity. Correlation clustering provides a method for clustering a set of objects into the optimum number of clusters without specifying that number in advance. Cluster analysis In machine learning, correlation clustering or cluster editing operates in a scenario where the relationships between the objects are known instead of the actual representations of the objects.
Compacité (mathématiques)En topologie, on dit d'un espace qu'il est compact s'il est séparé et qu'il vérifie la propriété de Borel-Lebesgue. La condition de séparation est parfois omise et certains résultats demeurent vrais, comme le théorème des bornes généralisé ou le théorème de Tychonov. La compacité permet de faire passer certaines propriétés du local au global, c'est-à-dire qu'une propriété vraie au voisinage de chaque point devient valable de façon uniforme sur tout le compact.
Tétraèdrethumb|Un tétraèdre. thumb|Paul Sérusier, Tétraèdres, vers 1910. En géométrie, les tétraèdres (du grec tétra : quatre) sont des polyèdres de la famille des pyramides, composés de triangulaires, et . Le 3-simplexe est la représentation abstraite du tétraèdre ; dans ce modèle, les arêtes s'identifient aux 6 sous-ensembles à 2 éléments de l'ensemble des quatre sommets, et les faces aux 4 sous-ensembles à 3 éléments. Chaque sommet d'un tétraèdre est relié à tous les autres par une arête, et de même chaque face est reliée à toutes les autres par une arête.
Clustering high-dimensional dataClustering high-dimensional data is the cluster analysis of data with anywhere from a few dozen to many thousands of dimensions. Such high-dimensional spaces of data are often encountered in areas such as medicine, where DNA microarray technology can produce many measurements at once, and the clustering of text documents, where, if a word-frequency vector is used, the number of dimensions equals the size of the vocabulary.
Espace localement compactEn topologie, un espace localement compact est un espace séparé qui admet des voisinages compacts pour tous ses points. Un tel espace n'est pas nécessairement compact lui-même mais on peut y généraliser (au moins partiellement) beaucoup de résultats sur les espaces compacts. Ce sont aussi les espaces qu'on peut « rendre » compacts avec un point grâce à la compactification d'Alexandrov. La compacité est une source très fertile de résultats en topologie mais elle reste une propriété très contraignante.
Partie relativement compacteEn mathématiques, une partie relativement compacte d'un espace topologique X est un sous-ensemble Y de X inclus dans une partie compacte de X (pour la topologie induite). Rappelons que dans la littérature française, un compact est supposé séparé. Si X est séparé, alors une partie de X est relativement compacte (si et) seulement si son adhérence est compacte. Dans un espace métrisable X, une partie Y est relativement compacte si et seulement si toute suite dans Y possède une sous-suite qui converge dans X.
PentachoreEn géométrie euclidienne de dimension quatre, le pentachore, ou 5-cellules, aussi appelé un pentatope ou 4-simplexe, est le polychore régulier convexe le plus simple. C'est la généralisation d'un triangle du plan ou d'un tétraèdre de l'espace. Le pentachore est constitué de 5 cellules, toutes des tétraèdres. C'est un polytope auto-dual. Sa figure de sommet est un tétraèdre. Son intersection maximale avec l'espace tridimensionnel est le prisme triangulaire. Le symbole de Schläfli du pentachore est {3,3,3}.