Pourquoi utiliser un test Z plutôt qu'un test T pour l'intervalle de confiance d'une proportion de population?

Aug 18 2020

Pourquoi utiliser un test Z plutôt qu'un test T pour l'intervalle de confiance d'une proportion de population?

Oublions une seconde les proportions de population. Disons que nous plaçons un intervalle de confiance sur la moyenne de la population d'une variable aléatoire X. Je crois comprendre que si la variance de X est connue, alors nous pouvons faire un test Z. Sinon (le cas courant), nous devons estimer la variance à partir de l'échantillon, et nous devrions donc faire un test T. Je crois comprendre que c'est vrai MÊME si X est normalement distribué. Autrement dit, si nous estimons la variance à partir de l'échantillon, la distribution d'échantillonnage (je ne suis pas sûr d'avoir cette partie tout à fait correcte) est une distribution T de n-1 degrés de liberté, même si X est normalement distribué.

Pourquoi la même logique ne s'applique-t-elle pas à l'estimation de la proportion de la population? Dans les manuels en ligne [2] et les vidéos [2], un test Z est effectué à la place. Je crois comprendre que si la taille de l'échantillon est grande, la distribution binomiale peut être approximée avec une distribution normale en raison du théorème de la limite centrale, mais même si tel est le cas, ne sommes-nous pas en train d'estimer la variance à partir de l'échantillon, ce qui implique la nécessité d'un Test T, pas un test Z?

[1] https://openstax.org/books/introductory-business-statistics/pages/8-3-a-confidence-interval-for-a-population-proportion

[2] https://www.youtube.com/watch?v=owYtDtmrCoE&list=PLvxOuBpazmsOXoys_s9qkbspk_BlOtWcW

Réponses

tommik Aug 18 2020 at 14:30

en quelques mots:

  • Le test T est utilisé pour estimer la moyenne lorsque la distribution de la population est dite gaussienne mais avec une variance inconnue

  • le test sur la propotion est un test sur une moyenne d'une population de bernulli. Dans certaines conditions, vous pouvez utiliser le test Z comme approximation car votre estimateur (c'est-à-dire le MLE) est asymptotiquement normal