Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
En statistiques, la marge d'erreur est une estimation de l'étendue que les résultats d'un sondage peuvent avoir si l'on recommence l'enquête. Plus la marge d'erreur est importante, moins les résultats sont fiables et plus la probabilité qu'ils soient écartés de la réalité est importante. La marge d'erreur peut être calculée directement à partir de la taille de l'échantillon (par exemple, le nombre de personnes sondées) et est habituellement reportée par l'un des trois différents niveaux de l'intervalle de confiance. Le niveau de 99 % est le plus prudent, le niveau de 95 % est le plus répandu, et le niveau de 90 % est rarement utilisé. Pour un niveau de confiance de 99 %, il y a 99 % de chances que, si la valeur réelle était égale à celle issue du sondage, alors on obtiendrait, dans un sondage établi dans les mêmes conditions, une valeur dans la marge d'erreur (ce qui ne signifie pas que la valeur réelle a 99 % de chances d'être dans la marge d'erreur). La marge d'erreur prend uniquement en compte l'erreur de l'échantillon. Elle ne prend pas en compte les autres sources potentielles d'erreurs, notamment, le biais dans les questions ou dans l'exclusion d'un groupe n'étant pas questionné, le fait que certaines personnes ne veulent pas répondre, le fait que certaines personnes mentent, les erreurs de calculs. Pour illustrer les concepts expliqués au cours de l'article, nous utiliserons l'exemple de la campagne présidentielle des États-Unis de 2004. Selon un sondage paru dans Newsweek, 47 % des électeurs voteraient pour John Kerry si l'élection avait lieu aujourd'hui. 45 % voteraient pour George W. Bush et 2 % pour Ralph Nader. La taille de l'échantillon est de personnes interrogées, et la marge d'erreur est de ±4 ppc. Dans le reste de l'article, nous utiliserons l'intervalle de confiance de 99 %. Un sondage nécessite de prendre un échantillon de la population. Dans le cas du sondage de Newsweek, la population prise en compte est les personnes qui voteront.
Marco Picasso, Paride Passelli
Jian Wang, Matthias Finger, Qian Wang, Yiming Li, Matthias Wolf, Varun Sharma, Yi Zhang, Konstantin Androsov, Jan Steggemann, Leonardo Cristella, Xin Chen, Davide Di Croce, Arvind Shah, Rakesh Chawla, Matteo Galli, Anna Mascellani, João Miguel das Neves Duarte, Tagir Aushev, Lei Zhang, Tian Cheng, Yixing Chen, Werner Lustermann, Andromachi Tsirou, Alexis Kalogeropoulos, Andrea Rizzi, Ioannis Papadopoulos, Paolo Ronchese, Hua Zhang, Siyuan Wang, Jessica Prisciandaro, Tao Huang, David Vannerom, Michele Bianco, Sebastiana Gianì, Sun Hee Kim, Kun Shi, Wei Shi, Abhisek Datta, Jian Zhao, Federica Legger, Gabriele Grosso, Ji Hyun Kim, Donghyun Kim, Zheng Wang, Sanjeev Kumar, Wei Li, Yong Yang, Geng Chen, Ajay Kumar, Ashish Sharma, Georgios Anagnostou, Joao Varela, Csaba Hajdu, Muhammad Ahmad, Ekaterina Kuznetsova, Ioannis Evangelou, Muhammad Shoaib, Milos Dordevic, Meng Xiao, Sourav Sen, Xiao Wang, Kai Yi, Jing Li, Rajat Gupta, Zhen Liu, Muhammad Waqas, Hui Wang, Seungkyu Ha, Maren Tabea Meinhard, Long Wang, Pratyush Das, Miao Hu, Anton Petrov, Xin Sun, Xin Gao, Chen Chen, Valérie Scheurer, Giovanni Mocellin, Muhammad Ansar Iqbal, Lukas Layer