Perché i test esatti sono preferiti al chi quadrato per campioni di piccole dimensioni?

Aug 18 2020

Sono consapevole del fatto che test come il test esatto di Fisher a volte sono preferibili al chi-quadrato se i valori attesi sono bassi in una tabella di contingenza, quando si cerca di testare l'omogeneità dei gruppi (storicamente le persone hanno suggerito 5 anche se alcuni sembrano pensare che questo sia conservativo) .

Non riesco tuttavia a trovare una spiegazione del motivo per cui il chi quadrato non funziona bene per campioni di piccole dimensioni. Ho quindi 2 domande:

  1. Cosa fa sì che i valori attesi in una tabella di contingenza diventino piccoli al diminuire della dimensione del campione? (Presumo che qui i piccoli valori attesi siano il risultato della piccola dimensione del campione).
  2. Perché il test del chi quadrato non dovrebbe essere utilizzato per campioni di piccole dimensioni? Ho visto persone dire che non si avvicina adeguatamente alla distribuzione teorica del chi quadrato, ma qualcuno può spiegare perché / come non lo fa?

Risposte

12 Ben Aug 18 2020 at 07:24

In un test di ipotesi classico, si dispone di una statistica test che ordina le prove da ciò che è più favorevole all'ipotesi nulla a quella che è più favorevole all'ipotesi alternativa. (Senza perdere di generalità, supponiamo che un valore più alto di questa statistica sia più favorevole all'ipotesi alternativa.) Il valore p del test è la probabilità di osservare l'evidenza almeno altrettanto favorevole all'ipotesi alternativa di ciò che hai effettivamente osservato ( una statistica test grande almeno quanto il valore osservato) assumendo che l'ipotesi nulla sia vera. Questo è calcolato dalla distribuzione nulla della statistica test, che è la sua distribuzione assumendo che l'ipotesi nulla sia vera.

Ora, un "test esatto" è un test che calcola esattamente il valore p --- cioè, lo calcola dalla vera distribuzione nulla della statistica del test. In molti test statistici, la vera distribuzione nulla è complicata, ma può essere approssimata da un'altra distribuzione e converge a quella distribuzione approssimativa come$n \rightarrow \infty$. In particolare, i cosiddetti "test del chi quadrato" sono test di ipotesi in cui la distribuzione nulla vera converge a una distribuzione chi quadrato.

Quindi, in un "test chi quadrato" di questo tipo, quando si calcola il valore p del test utilizzando la distribuzione chi quadrato, questa è solo un'approssimazione del valore p reale . Il vero valore p del test è dato dal test esatto e stai approssimando questo valore utilizzando la distribuzione nulla approssimativa della statistica del test. quando$n$ è grande questa approssimazione è molto buona, ma quando $n$è piccolo l'approssimazione potrebbe essere scarsa. Per questo motivo, gli statistici sconsigliano di utilizzare i "test del chi quadrato" (ovvero, utilizzando l'approssimazione del chi quadrato alla distribuzione nulla reale) quando$n$ è piccolo.


Test del chi quadrato per l'indipendenza nelle tabelle di contingenza: ora esaminerò le tue domande specifiche in relazione ai test del chi quadrato per testare l'indipendenza nelle tabelle di contingenza. In questo contesto, se abbiamo una tabella di contingenza con conteggi osservati$O_1,...,O_K$ sommando a $n \equiv \sum O_i$ quindi la statistica del test è la statistica di Pearson:

$$\chi^2 = \sum_{i=1}^K \frac{(O_i-E_i)^2}{E_i},$$

dove $E_1,...,E_K$ sono i valori di cella attesi nell'ipotesi nulla.$^\dagger$ La prima cosa da notare qui è che i conti osservati $O_1,...,O_K$sono numeri interi non negativi. Per ogni$n<\infty$questo limita i possibili valori della statistica test a un insieme finito di valori possibili, quindi la sua vera distribuzione nulla sarà una distribuzione discreta su questo insieme finito di valori. Nota che la distribuzione del chi quadrato non può essere la vera distribuzione nulla perché è una distribuzione continua su tutti i numeri reali non negativi --- un insieme infinito di valori (non numerabili).

Come in altri "test chi quadrato", la distribuzione nulla della statistica del test qui è ben approssimata dalla distribuzione chi quadrato quando $n$è grande. Non hai ragione nel dire che si tratta di non riuscire ad "approssimare adeguatamente la distribuzione teorica del chi quadrato" --- al contrario, la distribuzione teorica del chi quadrato è l'approssimazione , non la vera distribuzione nulla. L'approssimazione del chi quadrato è buona fintanto che nessuno dei valori$E_1,...,E_K$è piccolo. Il motivo per cui questi valori attesi sono piccoli per valori bassi di$n$ è che quando hai un valore di conteggio totale basso, devi aspettarti che i conteggi in almeno alcune celle siano bassi.


$^\dagger$Per l'analisi delle tabelle di contingenza, questi conteggi cellulari attesi sono ottenuti condizionando i totali marginali sotto l'ipotesi nulla di indipendenza. Non è necessario per noi entrare in ulteriori dettagli su questi valori.