Résumé
En statistique, le jackknife ( couteau suisse) est une méthode de rééchantillonnage qui tire son nom de couteau suisse du fait qu'elle peut être utile à diverses choses : réduction du biais en petit échantillon, construction d'un intervalle de confiance raisonnable pour toute sorte de statistiques, test statistique. À partir des années 70, cette méthode de rééchantillonnage a été « remplacée » par une méthode plus sophistiquée, le bootstrap. Cette méthode a été développée par (1924-1973). On dispose d'un échantillon , iid selon une loi inconnue F. On souhaite estimer l'espérance, notée : Un estimateur naturel est la moyenne empirique : Un moyen de mesurer l'impact d'une observation sur l'estimateur est de calculer la moyenne empirique sur l'échantillon , à savoir l'échantillon initial X privé de sa j observation : On remarque que et en passant à la moyenne que où est la moyenne des estimations partielles : Ainsi, on a ce qui signifie qu'on a à disposition un nouvel estimateur de l'espérance : il s'agit de son estimation jackknife. Dans l'exposé précédent, la méthode du jackknife n'apporte rien dans le sens où il est confondu avec l'estimateur naturel. La généralisation montre qu'il en va tout autrement lorsqu'on considère un paramètre quelconque à estimer. Une estimation de est . Comme précédemment, on considère l'estimation de sur l'échantillon privé de sa j observation : ce qui permet de poser comme étant la j pseudo-valeur. Ces estimations partielles peuvent être vues comme des variables indépendantes et d'espérance . On peut alors définir l'estimateur jackknife de en prenant la moyenne empirique : On peut généraliser cette approche en considérant un échantillon amputé non plus d'une seule observations, mais de plusieurs. Le point clé reste la définition des pseudo valeurs et de leur moyenne . Principe général Maurice Quenouille a montré en 1949 que l'estimateur jackknife permet de réduire le biais de l'estimation initiale . Supposons pour cela que . Bien sûr, d'autres termes en peuvent être considérés.
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Cours associés (2)
MATH-517: Statistical computation and visualisation
The course will provide the opportunity to tackle real world problems requiring advanced computational skills and visualisation techniques to complement statistical thinking. Students will practice pr
BIO-322: Introduction to machine learning for bioengineers
Students understand basic concepts and methods of machine learning. They can describe them in mathematical terms and can apply them to data using a high-level programming language (julia/python/R).
Publications associées (26)
Personnes associées (1)