Concept

Summary statistics

In descriptive statistics, summary statistics are used to summarize a set of observations, in order to communicate the largest amount of information as simply as possible. Statisticians commonly try to describe the observations in a measure of location, or central tendency, such as the arithmetic mean a measure of statistical dispersion like the standard mean absolute deviation a measure of the shape of the distribution like skewness or kurtosis if more than one variable is measured, a measure of statistical dependence such as a correlation coefficient A common collection of order statistics used as summary statistics are the five-number summary, sometimes extended to a seven-number summary, and the associated box plot. Entries in an analysis of variance table can also be regarded as summary statistics. Common measures of location, or central tendency, are the arithmetic mean, median, mode, and interquartile mean. Common measures of statistical dispersion are the standard deviation, variance, range, interquartile range, absolute deviation, mean absolute difference and the distance standard deviation. Measures that assess spread in comparison to the typical size of data values include the coefficient of variation. The Gini coefficient was originally developed to measure income inequality and is equivalent to one of the L-moments. A simple summary of a dataset is sometimes given by quoting particular order statistics as approximations to selected percentiles of a distribution. Common measures of the shape of a distribution are skewness or kurtosis, while alternatives can be based on L-moments. A different measure is the distance skewness, for which a value of zero implies central symmetry. The common measure of dependence between paired random variables is the Pearson product-moment correlation coefficient, while a common alternative summary statistic is Spearman's rank correlation coefficient. A value of zero for the distance correlation implies independence. Humans efficiently use summary statistics to quickly perceive the gist of auditory and visual information.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Cours associés (32)
MATH-131: Probability and statistics
Le cours présente les notions de base de la théorie des probabilités et de l'inférence statistique. L'accent est mis sur les concepts principaux ainsi que les méthodes les plus utilisées.
MICRO-428: Metrology
The course deals with the concept of measuring in different domains, particularly in the electrical, optical, and microscale domains. The course will end with a perspective on quantum measurements, wh
MATH-413: Statistics for data science
Statistics lies at the foundation of data science, providing a unifying theoretical and methodological backbone for the diverse tasks enountered in this emerging field. This course rigorously develops
Afficher plus
Séances de cours associées (179)
Probabilité et statistiques
Introduit la probabilité, les statistiques, les distributions, l'inférence, la probabilité et la combinatoire pour étudier les événements aléatoires et la modélisation en réseau.
Probabilité et statistiques
Couvre les concepts fondamentaux des probabilités et des statistiques, y compris les distributions, les propriétés et les attentes des variables aléatoires.
Modes de convergence des variables aléatoires
Couvre les modes de convergence des variables aléatoires et du théorème des limites centrales, en discutant des implications et des approximations.
Afficher plus
Publications associées (71)

DESI mock challenge Halo and galaxy catalogues with the bias assignment method

Cheng Zhao, Ginevra Favole, Yu Yu

Context. We present a novel approach to the construction of mock galaxy catalogues for large-scale structure analysis based on the distribution of dark matter halos obtained with effective bias models at the field level. Aims. We aim to produce mock galaxy ...
EDP SCIENCES S A2023

Interventionist estimands in event history analysis

Matias Janvin

The presence of competing events, such as death, makes it challenging to define causal effects on recurrent outcomes. In this thesis, I formalize causal inference for recurrent events, with and without competing events. I define several causal estimands an ...
EPFL2023

Euclid preparation: XXVIII. Forecasts for ten different higher-order weak lensing statistics

Frédéric Courbin, Gianluca Castignani, Jean-Luc Starck, Austin Chandler Peel, Maurizio Martinelli, Yi Wang, Richard Massey, Fabio Finelli, Marcello Farina

Recent cosmic shear studies have shown that higher-order statistics (HOS) developed by independent teams now outperform standard two-point estimators in terms of statistical precision thanks to their sensitivity to the non-Gaussian features of large-scale ...
EDP SCIENCES S A2023
Afficher plus
Concepts associés (23)
Statistique d'ordre
En statistiques, la statistique d'ordre de rang k d'un échantillon statistique est égal à la k-ième plus petite valeur. Associée aux statistiques de rang, la statistique d'ordre fait partie des outils fondamentaux de la statistique non paramétrique et de l'inférence statistique. Deux cas importants de la statistique d'ordre sont les statistiques du minimum et du maximum, et dans une moindre mesure la médiane de l'échantillon ainsi que les différents quantiles.
Quartile
vignette|Histogramme avec représentation visuelle des quartiles. En statistique descriptive, un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de population. Le quartile fait partie des quantiles.
Valeur absolue des écarts
En statistique, la déviation absolue moyenne (ou simplement déviation moyenne) d'un ensemble est la moyenne (ou valeur prévue) des déviations absolues par rapport à un point central d'une série statistique. C'est une statistique sommaire de dispersion ou de variabilité statistique, et elle peut être associée à toute mesure à une tendance centrale (moyenne, médiane, mode...). La déviation absolue d'un élément a d'un ensemble de données x par rapport à un réel est a – x.
Afficher plus
MOOCs associés (8)
Optimization: principles and algorithms - Linear optimization
Introduction to linear optimization, duality and the simplex algorithm.
Optimization: principles and algorithms - Linear optimization
Introduction to linear optimization, duality and the simplex algorithm.
Optimization: principles and algorithms - Network and discrete optimization
Introduction to network optimization and discrete optimization
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.