Jak można $t$-statystyczna służyć do testowania hipotezy?

Aug 15 2020

Mam następujące pytanie: Próba losowa wielkości 25 z rozkładu normalnego ma średnią 47 i odchylenie standardowe 7. Na podstawie $t$-statystyki, czy możemy powiedzieć, że podane informacje potwierdzają przypuszczenie, że średnia populacji wynosi 42?

Jestem naprawdę zdezorientowany, jak $t$-statystyka działa tak, aby odrzucić lub nie odrzucić hipotezy. Wyjaśnienie byłoby naprawdę pomocne. Dzięki!

Odpowiedzi

2 BruceET Aug 16 2020 at 01:35

Dwustronny test T na jedną próbkę

Po prostu miałem normalny zbiór danych z $n=25, \bar X = 57, S = 7$ w moim oknie R Session.

Czy dane są odpowiednie dla testu? Oto podsumowanie danych, obliczone przez R:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

W przybliżeniu symetryczne dane bez odległych wartości odstających; przechodzi test normalności Shapiro-Wilka z wartością P powyżej$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Dane są wystarczająco zbliżone do normalnych, aby test był ważny.

Wydruk R dla testu t. Tak więc tutaj jest wyjście z R dla testu t dla jednej próbki$H_0: \mu = 42$ przeciwko $H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47 

Interpretacja wyników. Wartość p wynosi$0.0015 < 0.05 = 5\%,$ więc odrzucilibyście $H_0$na poziomie istotności 5%. Możesz również odrzucić na poziomie 1%.

Wynik daje również 95% przedział ufności (CI) $(44.11, 49.89),$ więc możemy stwierdzić prawdziwą wartość $\mu$jest w tym przedziale - który nie zawiera$\mu = 42.$

Jedną z interpretacji tego CI jest to, że jest to przedział „niemożliwych do odrzucenia” hipotez zerowych, opartych na danych.

Szczegóły, które powinieneś wiedzieć o teście. @PeterForeman pokazał, jak obliczyć statystykę T. Z wyjątkiem wartości P, powinieneś być w stanie odtworzyć wszystko inne w wyniku przez ręczne obliczenia.

  • Dokładne wartości P są podane na wydrukach komputerowych. Patrząc na wydrukowaną tabelę t, powinieneś być w stanie „nawiasować” wartość P. Na przykład moja tabela ma wartości 2,467 i 3,745 w wierszu DF = 24, które obejmują statystykę T 3,5714. Patrząc na górny margines mojej tabeli, widzę, że wartość P musi znajdować się pomiędzy$2(0.001) = 0.002$ i $2(0.0005) = 0.001,$co zgadza się z wartością z R. [Są 2to, ponieważ jest to dwustronny test t.]

  • Możesz uzyskać dokładną wartość P tego dwustronnego testu w R lub innym oprogramowaniu statystycznym. Jest to prawdopodobieństwo wystąpienia statystyki T. dalej od$0$ niż obserwowane $T =3.5714.$W R, gdzie ptjest CDF rozkładu t Studenta, następujące obliczenia przybliżają cię do wartości P na wydruku. (Jeśli wartość raportowanej statystyki T jest zaokrąglona, ​​wówczas wartość P może nie być dokładnie dopasowana, ale tylko kilka pierwszych miejsc dziesiętnych ma znaczenie przy podejmowaniu decyzji).

.

2 * (1 - pt(3.5714, 24))
[1] 0.001543522
  • Odpowiadając na jedno z pytań w komentarzach: Z wydrukowanej tabeli t można powiedzieć, że krytyczną wartością do odrzucenia na poziomie 5% jest$c = 2.064.$ To znaczy odrzucić na poziomie 5% $|T| > 2.064,$który to jest. Wartość krytyczna zmniejsza prawdopodobieństwo$0.025 = 2.5\% $z górnego ogona rozkładu t-Studenta przy DF = 24. W R, gdzie qtjest funkcją kwantylową (odwrotność CDF), można uzyskać 5% wartość krytyczną, jak pokazano poniżej. Jaka jest krytyczna wartość testu na 1% poziomie istotności?

${}$

qt(.975, 24)
[1] 2.063899

Graficzne podsumowanie. Poniższy rysunek przedstawia funkcję gęstości rozkładu t-Studenta przy 24 DF. Pionowy niebieski symbol przedstawia obserwowaną wartość statystyki T. Wartość P jest dwukrotnością obszaru pod krzywą na prawo od tej linii. Dolne i górne wartości krytyczne dla testu na poziomie 5% są przedstawione pionowymi przerywanymi pomarańczowymi liniami; czerwone linie (dalej) do testu na poziomie 1%.