Concept

Boîte à moustaches

Dans les représentations graphiques de données statistiques, la boîte à moustaches, aussi appelée diagramme en boîte, boîtes à pattes, boîte de Tukey (en anglais, box-and-whisker plot, plus simplement box plot) est un moyen rapide de figurer le profil essentiel d'une série statistique quantitative. Elle a été inventée en 1977 par John Tukey, mais peut faire l'objet de certains aménagements selon les utilisateurs. La boîte à moustaches résume seulement quelques indicateurs de position du caractère étudié (médiane, quartiles, minimum, maximum ou déciles). Ce diagramme est utilisé principalement pour comparer un même caractère dans deux populations de tailles différentes. Il s'agit de tracer un rectangle allant du premier quartile au troisième quartile et coupé par la médiane. Ce rectangle suffit pour le diagramme en boîte. On ajoute alors des segments aux extrémités menant jusqu'aux valeurs extrêmes, ou jusqu'aux premier et neuvième déciles (), voire aux et centiles. On parle alors de diagramme en boîte à moustaches ou de diagramme à pattes. Comparaison de deux diagrammes en boîte à moustaches avec : pour la boîte supérieure : Q1 = 7, M = 9, Q3 = 12, , ; pour la boîte inférieure : Q1 = 3, M = 7, Q3 = 12, , . Dans les diagrammes en boîte de Tukey, la longueur des « moustaches » vaut 1,5 fois l’écart interquartile. Ces diagrammes de Tukey étaient utilisés dans des secteurs où les données peuvent le plus souvent être modélisées en utilisant une loi normale ; dans ce cas, la théorie montre que les extrémités des « moustaches » sont voisines du premier et centile (0,022 et 0,978 précisément) : ces diagrammes étaient surtout utilisés pour détecter la présence de données exceptionnelles. Cet exemple est basé sur une série de mesures avec les 20 points de données suivants : Une boîte à moustaches aide à obtenir un aperçu de ces données très rapidement. Ainsi, elle rend visible le fait que la médiane est exactement égale à 8,5 (moyenne = 7,75) et que chacun des 25 % des données sont inférieures à 7 et supérieures à 9,5.

Source officielle

https://fr.wikipedia.org/wiki/Boîte_à_moustaches

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Cours associés (11)

MATH-131: Probability and statistics

Le cours présente les notions de base de la théorie des probabilités et de l'inférence statistique. L'accent est mis sur les concepts principaux ainsi que les méthodes les plus utilisées.

CS-401: Applied data analysis

This course teaches the basic techniques, methodologies, and practical skills required to draw meaningful insights from a variety of data, with the help of the most acclaimed software tools in the dat

MSE-213: Probability and statistics for materials science

The course establishes the concepts of statistical analysis, probability theory, and data analysis. This includes standard statistical tests, correlation analysis and experimental design. It introduce

Afficher plus

Concepts associés (13)

Statistique d'ordre

En statistiques, la statistique d'ordre de rang k d'un échantillon statistique est égal à la k-ième plus petite valeur. Associée aux statistiques de rang, la statistique d'ordre fait partie des outils fondamentaux de la statistique non paramétrique et de l'inférence statistique. Deux cas importants de la statistique d'ordre sont les statistiques du minimum et du maximum, et dans une moindre mesure la médiane de l'échantillon ainsi que les différents quantiles.

Quartile

vignette|Histogramme avec représentation visuelle des quartiles. En statistique descriptive, un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de population. Le quartile fait partie des quantiles.

Range (statistics)

In statistics, the range of a set of data is the difference between the largest and smallest values, the result of subtracting the sample maximum and minimum. It is expressed in the same units as the data. In descriptive statistics, range is the size of the smallest interval which contains all the data and provides an indication of statistical dispersion. Since it only depends on two of the observations, it is most useful in representing the dispersion of small data sets.

Afficher plus

Source officielle

https://fr.wikipedia.org/wiki/Boîte_à_moustaches

À propos de ce résultat

Cours associés (11)

MATH-131: Probability and statistics

Le cours présente les notions de base de la théorie des probabilités et de l'inférence statistique. L'accent est mis sur les concepts principaux ainsi que les méthodes les plus utilisées.

CS-401: Applied data analysis

MSE-213: Probability and statistics for materials science

Afficher plus

Séances de cours associées (30)

Types de variables et distribution multinomiale

Introduit les types de variables, la distribution multinomiale, les caractéristiques des données, les formes des densités, la corrélation et les méthodes de visualisation des données.

Statistiques: Analyse exploratoire des données

Introduit les bases statistiques, y compris l'analyse des données et la théorie des probabilités, en mettant l'accent sur la tendance centrale, la dispersion et les formes de distribution.

Analyse statistique: Boxplot et distribution normale

Introduit des concepts d'analyse statistique comme boxplot et la distribution normale à l'aide d'exemples de données réelles.

Afficher plus

Publications associées (9)

Gaia's brightest very metal-poor (VMP) stars Metallicity catalogue of a thousand VMP stars from Gaia's radial velocity spectrometer spectra

Nicolas Lawrence Etienne Longeard

Context. Gaia DR3 has offered the scientific community a remarkable dataset of approximately one million spectra acquired with the radial velocity spectrometer (RVS) in the calcium II triplet region, which is well suited to identify very metal-poor (VMP) s ...

Edp Sciences S A2024

Leukocyte Count and Coronary Artery Disease Events in People With Human Immunodeficiency Virus: A Longitudinal Study

Jacques Fellay, Christian Axel Wandall Thorball

Leukocyte count is associated with coronary artery disease (CAD) events in the general population. Here we show that leukocytes are independently associated with CAD events in people with HIV in Switzerland, after adjusting for traditional and HIVrelated r ...

OXFORD UNIV PRESS INC2023

3-Dimensional Fluid and White Matter Suppression Magnetic Resonance Imaging Sequence Accelerated With Compressed Sensing Improves Multiple Sclerosis Cervical Spinal Cord Lesion Detection Compared With Standard 2-Dimensional Imaging

Tobias Kober

Objectives Fluid and white matter suppression (FLAWS) is a recently proposed magnetic resonance sequence derived from magnetization-prepared 2 rapid acquisition gradient-echo providing 2 coregistered datasets with white matter- and cerebrospinal fluid-supp ...

LIPPINCOTT WILLIAMS & WILKINS2022

Afficher plus

Concepts associés (13)