Pourquoi les tests exacts sont-ils préférés au chi carré pour les échantillons de petite taille?

Aug 18 2020

Je suis conscient que des tests tels que le test exact de Fisher sont parfois préférables au chi carré si vos valeurs attendues sont faibles dans un tableau de contingence, lorsque vous cherchez à tester l'homogénéité des groupes (historiquement, les gens ont suggéré 5 bien que certains semblent penser que c'est conservateur) .

Je n'arrive cependant pas à trouver une explication de la raison pour laquelle le chi-carré ne fonctionne pas bien pour les petits échantillons. J'ai donc 2 questions:

Qu'est-ce qui fait que les valeurs attendues dans un tableau de contingence deviennent petites à mesure que la taille de l'échantillon diminue? (Je suppose ici que les petites valeurs attendues sont le résultat de la petite taille de l'échantillon).
Pourquoi le test du chi carré ne devrait-il pas être utilisé pour les échantillons de petite taille? J'ai vu des gens dire que cela ne se rapproche pas suffisamment de la distribution théorique du chi carré, mais quelqu'un peut-il expliquer pourquoi / comment ce n'est pas le cas?

Réponses

12 Ben Aug 18 2020 at 07:24

Dans un test d'hypothèse classique, vous avez une statistique de test qui classe les preuves de ce qui est le plus propice à l'hypothèse nulle à ce qui est le plus propice à l'hypothèse alternative. (Sans perte de généralité, supposons qu'une valeur plus élevée de cette statistique soit plus propice à l'hypothèse alternative.) La valeur p du test est la probabilité d'observer des preuves au moins aussi propices à l'hypothèse alternative que ce que vous avez réellement observé ( une statistique de test au moins aussi grande que la valeur observée) sous l'hypothèse que l'hypothèse nulle est vraie. Ceci est calculé à partir de la distribution nulle de la statistique de test, qui est sa distribution sous l'hypothèse que l'hypothèse nulle est vraie.

Maintenant, un "test exact" est un test qui calcule exactement la valeur p - c'est-à-dire qu'il calcule cela à partir de la vraie distribution nulle de la statistique de test. Dans de nombreux tests statistiques, la vraie distribution nulle est compliquée, mais elle peut être approximée par une autre distribution, et elle converge vers cette distribution approximative comme$n \rightarrow \infty$. En particulier, les soi-disant «tests du chi-carré» sont des tests d'hypothèse où la vraie distribution nulle converge vers une distribution du chi-carré.

Ainsi, dans un «test du chi carré» de ce type, lorsque vous calculez la valeur p du test en utilisant la distribution du chi carré, il ne s'agit que d'une approximation de la vraie valeur p . La vraie valeur p du test est donnée par le test exact, et vous approchez cette valeur en utilisant la distribution nulle approximative de la statistique de test. Quand$n$ est grande, cette approximation est très bonne, mais quand $n$est petite, l'approximation peut être médiocre. Pour cette raison, les statisticiens déconseillent d'utiliser les «tests du chi-carré» (c'est-à-dire en utilisant l'approximation du chi-carré de la vraie distribution nulle) lorsque$n$ est petite.

Tests d'indépendance du chi carré dans les tableaux de contingence: Je vais maintenant examiner vos questions spécifiques en relation avec les tests du chi carré pour tester l'indépendance dans les tableaux de contingence. Dans ce contexte, si nous avons un tableau de contingence avec les décomptes observés$O_1,...,O_K$ sommation à $n \equiv \sum O_i$ alors la statistique de test est la statistique de Pearson:

$$\chi^2 = \sum_{i=1}^K \frac{(O_i-E_i)^2}{E_i},$$

où $E_1,...,E_K$ sont les valeurs de cellule attendues sous l'hypothèse nulle.$^\dagger$ La première chose à noter ici est que les comptes observés $O_1,...,O_K$sont des entiers non négatifs. Pour toute$n<\infty$cela limite les valeurs possibles de la statistique de test à un ensemble fini de valeurs possibles, donc sa vraie distribution nulle sera une distribution discrète sur cet ensemble fini de valeurs. Notez que la distribution chi-carré ne peut pas être la vraie distribution nulle car il s'agit d'une distribution continue sur tous les nombres réels non négatifs --- un ensemble infini (indénombrable) de valeurs.

Comme dans d'autres "tests du chi carré", la distribution nulle de la statistique de test est ici bien approximée par la distribution du chi carré lorsque $n$est large. Vous n'avez pas raison de dire que c'est une question de ne pas «approcher adéquatement la distribution théorique du chi carré» - au contraire, la distribution théorique du chi carré est l'approximation , pas la vraie distribution nulle. L'approximation du chi carré est bonne tant qu'aucune des valeurs$E_1,...,E_K$est petite. La raison pour laquelle ces valeurs attendues sont petites pour des valeurs faibles de$n$ est que lorsque vous avez une valeur de comptage totale faible, vous devez vous attendre à ce que les nombres dans au moins certaines cellules soient faibles.

$^\dagger$Pour l'analyse des tableaux de contingence, ces nombres de cellules attendus sont obtenus en conditionnant les totaux marginaux sous l'hypothèse nulle d'indépendance. Il n’est pas nécessaire que nous approfondissions ces valeurs.