Bootstrap (statistiques)

En statistiques, les techniques de bootstrap sont des méthodes d'inférence statistique basées sur la réplication multiple des données à partir du jeu de données étudié, selon les techniques de rééchantillonnage. Elles datent de la fin des années 1970, époque où la possibilité de calculs informatiques intensifs devient abordable. On calculait depuis près d'un siècle des estimations : mesures de dispersion (variance, écart-type), intervalles de confiance, tables de décision pour des tests d'hypothèse, etc., à partir des expressions mathématiques des lois de probabilité, ainsi que d'approximations de celles-ci quand le calcul n'était pas réalisable. Désormais, l'approche par calcul stochastique sur technologie numérique permet de multiplier ces évaluations, et surtout de quantifier la sensibilité de ces évaluations aux particularités de l'échantillon originel, i.e. le jeu de données étudié, grâce à l'analyse statistique des sous-échantillons possibles. Cette méthode est basée sur des simulations stochastiques, comme les méthodes de Monte-Carlo, les méthodes numériques bayésiennes (échantillonneur de Gibbs, l'algorithme de Metropolis-Hastings), à la différence près que le bootstrap ne nécessite pas d'autre information que celle disponible sur les individus de l'échantillon originel. Plus précisément, et c'est le sens du terme « rééchantillonnage », un bootstrap consiste à créer des « nouveaux échantillons » statistiques, mais uniquement par tirage avec remise, à partir de l'échantillon initial. L'aspect autocentré et itératif de la méthode a inspiré sa désignation anglaise : en effet, le bootstrap désigne le fait de « se hisser en tirant sur ses propres lacets ou plus précisément sur ses « bootstraps » qui désignent en anglais les anneaux de cuir ou tissu cousus au rebord des bottes pour y passer les doigts afin de les enfiler plus facilement ». Soit un échantillon de observations, indépendantes et identiquement distribuées (iid) selon une loi (inconnue) . On souhaite estimer la quantité , comme l'espérance de la loi, sa médiane ou encore sa variance.

A Geometric Unification of Distributionally Robust Covariance Estimators: Shrinking the Spectrum by Inflating the Ambiguity Set

Daniel Kuhn, Viet Anh Nguyen, Yves Rychener

The state-of-the-art methods for estimating high-dimensional covariance matrices all shrink the eigenvalues of the sample covariance matrix towards a data-insensitive shrinkage target. The underlying shrinkage transformation is either chosen heuristically ...

2024

Robust Data-Driven Controller Design with Finite Frequency Samples

Alireza Karimi, Philippe Louis Schuchert

Modern control synthesis methods rely on accurate models to derive a performant controller. Obtaining a good model is often a costly step, and has led to a renewed interest in data-driven synthesis methods. Frequency-response-based synthesis methods have b ...

2024

A Geometric Unification of Distributionally Robust Covariance Estimators: Shrinking the Spectrum by Inflating the Ambiguity Set

Robust Data-Driven Controller Design with Finite Frequency Samples

Bootstrapping smooth conformal defects in Chern-Simons-matter theories

Graph Chatbot

Chattez avec Graph Search

Bootstrapping smooth conformal defects in Chern-Simons-matter theories