Réduction de la dimensionnalitévignette|320x320px|Animation présentant la projection de points en deux dimensions sur les axes obtenus par analyse en composantes principales, une méthode populaire de réduction de la dimensionnalité La réduction de la dimensionnalité (ou réduction de (la) dimension) est un processus étudié en mathématiques et en informatique, qui consiste à prendre des données dans un espace de grande dimension, et à les remplacer par des données dans un espace de plus petite dimension.
Fléau de la dimensionLe fléau de la dimension ou malédiction de la dimension (curse of dimensionality) est un terme inventé par Richard Bellman en 1961 pour désigner divers phénomènes qui ont lieu lorsque l'on cherche à analyser ou organiser des données dans des espaces de grande dimension alors qu'ils n'ont pas lieu dans des espaces de dimension moindre. Plusieurs domaines sont concernés et notamment l'apprentissage automatique, la fouille de données, les bases de données, l'analyse numérique ou encore l'échantillonnage.
Analyse fractalethumb|Ramification fractale d'un arbre L'analyse fractale est la modélisation de données dont la fractalité est la propriété inhérente. La notion-clé est celle de fractal qui remonte à Benoît Mandelbrot qui l'avait introduite comme description mathématique des objets râpeux. L'analyse fractale s'applique aux systèmes physiques qui se distinguent par une similarité de comportements au travers d'une multitude d'échelles ou, dans des cas les plus prononcés, par l'autosimilarité où cette similarité est conservée au travers d'une infinitude d'échelles.
DimensionLe terme dimension, du latin dimensio « action de mesurer », désigne d’abord chacune des grandeurs d’un objet : longueur, largeur et profondeur, épaisseur ou hauteur, ou encore son diamètre si c'est une pièce de révolution. L’acception a dérivé de deux façons différentes en physique et en mathématiques. En physique, la dimension qualifie une grandeur indépendamment de son unité de mesure, tandis qu’en mathématiques, la notion de dimension correspond au nombre de grandeurs nécessaires pour identifier un objet, avec des définitions spécifiques selon le type d’objet (algébrique, topologique ou combinatoire notamment).
Dimension fractaleEn géométrie fractale, la dimension fractale, D, est une grandeur qui a vocation à traduire la façon qu'a un ensemble fractal de remplir l'espace, à toutes les échelles. Dans le cas des fractales, elle est non entière et supérieure à la dimension topologique. Ce terme est un terme générique qui recouvre plusieurs définitions. Chacune peut donner des résultats différents selon l'ensemble considéré, il est donc essentiel de mentionner la définition utilisée lorsqu'on valorise la dimension fractale d'un ensemble.
Dimension de Minkowski-BouligandEn géométrie fractale, la dimension de Minkowski-Bouligand, également appelée dimension de Minkowski, dimension box-counting ou capacité, est une manière de déterminer la dimension fractale d'un sous-ensemble S dans un espace euclidien ou, plus généralement, dans un espace métrique. Pour calculer cette dimension pour une fractale S, placer cette fractale dans un réseau carré et compter le nombre de cases nécessaires pour recouvrir l'ensemble. La dimension de Minkowski est calculée en observant comment ce nombre de cases évolue à mesure que le réseau s'affine à l'infini.
Nonlinear dimensionality reductionNonlinear dimensionality reduction, also known as manifold learning, refers to various related techniques that aim to project high-dimensional data onto lower-dimensional latent manifolds, with the goal of either visualizing the data in the low-dimensional space, or learning the mapping (either from the high-dimensional space to the low-dimensional embedding or vice versa) itself. The techniques described below can be understood as generalizations of linear decomposition methods used for dimensionality reduction, such as singular value decomposition and principal component analysis.
Jeu de donnéesvignette|Représentation du jeu de données Iris sur ses quatre dimensions|420x420px Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs « organisées » ou « contextualisées » (alias « données »), où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique).
Flocon de KochLe flocon de Koch () est l'une des premières courbes fractales à avoir été décrites, bien avant l'invention du terme « fractal(e) » par Benoît Mandelbrot. Elle a été inventée en 1904 par le mathématicien suédois Helge von Koch. thumb|Les 4 premières étapes de la construction. thumb|Les 6 premières courbes successives en animation. On peut la créer à partir d'un segment de droite, en modifiant récursivement chaque segment de droite de la façon suivante : On divise le segment de droite en trois segments de longueurs égales.
Box countingBox counting is a method of gathering data for analyzing complex patterns by breaking a dataset, object, image, etc. into smaller and smaller pieces, typically "box"-shaped, and analyzing the pieces at each smaller scale. The essence of the process has been compared to zooming in or out using optical or computer based methods to examine how observations of detail change with scale. In box counting, however, rather than changing the magnification or resolution of a lens, the investigator changes the size of the element used to inspect the object or pattern (see Figure 1).