Как может$t$-статистика может быть использована для проверки гипотезы?

Aug 15 2020

У меня следующий вопрос: случайная выборка размера 25 из нормального распределения имеет среднее значение 47 и стандартное отклонение 7. На основе$t$-статистики, можем ли мы сказать, что данная информация поддерживает гипотезу о том, что среднее значение населения равно 42?

Я действительно смущен, как$t$- статистика работает, чтобы отвергнуть или не опровергнуть гипотезу. Объяснение было бы очень полезно. Спасибо!

Ответы

2 BruceET Aug 16 2020 at 01:35

Двусторонний одновыборочный T-тест

Просто оказался нормальный набор данных с$n=25, \bar X = 57, S = 7$в моем окне сеанса R.

Соответствуют ли данные тесту? Вот сводка данных, вычисленных R:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

Приблизительно симметричные данные без значительных выбросов; проходит тест нормальности Шапиро-Уилка с P-значением выше$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Данные достаточно близки к норме, чтобы тест был достоверным.

Распечатка R для t-теста. Таким образом, вот выходные данные R для одновыборочного t-критерия$H_0: \mu = 42$против$H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47

Интерпретация вывода. P-значение$0.0015 < 0.05 = 5\%,$так что вы бы отказались$H_0$на 5% уровне значимости. Вы также можете отклонить на уровне 1%.

Выходные данные также дают 95% доверительный интервал (ДИ).$(44.11, 49.89),$Таким образом, мы можем сделать вывод об истинной стоимости$\mu$находится в том интервале, который не содержит$\mu = 42.$

Одна из интерпретаций этого CI состоит в том, что это интервал «неопровержимых» нулевых гипотез, основанных на ваших данных.

Подробности, которые вы должны знать о тесте. @PeterForeman показал вам, как вычислить T-статистику. За исключением P-значения, вы должны быть в состоянии воспроизвести все остальное в выходных данных путем ручного вычисления.

Точные значения P приведены в компьютерных распечатках. Глядя на распечатанную таблицу t, вы сможете «заключить в скобки» P-значение. Например, в моей таблице есть значения 2,467 и 3,745 в строке DF = 24, которые заключают в себе T-статистику 3,5714. Глядя на верхнее поле моей таблицы, я вижу, что P-значение должно быть между$2(0.001) = 0.002$а также$2(0.0005) = 0.001,$что согласуется со значением из R. [ 2S указаны потому, что это двусторонний t-критерий.]
Вы можете получить точное значение P этого двустороннего теста в R или другом статистическом программном обеспечении. Это вероятность того, что статистика T дальше от$0$чем наблюдаемое$T =3.5714.$В R, где ptCDF распределения Стьюдента t, следующее вычисление очень близко приближает вас к P-значению в распечатке. (Если значение сообщаемой статистики T округлено, то P-значение может не совпадать точно, но для принятия решения имеют значение только первые два десятичных знака.)

2 * (1 - pt(3.5714, 24))
[1] 0.001543522

Чтобы ответить на один из ваших вопросов в комментариях: Из распечатанной таблицы t можно сказать, что критическое значение для отбраковки на уровне 5% составляет$c = 2.064.$То есть вы бы отклонили на уровне 5%$|T| > 2.064,$что это такое. Критическое значение снижает вероятность$0.025 = 2.5\% $из верхнего хвоста распределения Стьюдента с DF = 24. В R, где qtфункция квантиля (обратная CDF), вы можете получить критическое значение 5%, как показано ниже. Каково критическое значение для теста на уровне значимости 1%?

${}$

qt(.975, 24)
[1] 2.063899

Графическое резюме. На рисунке ниже показана функция плотности распределения Стьюдента с 24 DF. Вертикальный синий цвет показывает наблюдаемое значение Т-статистики. Значение P равно удвоенной площади под кривой справа от этой линии. Нижнее и верхнее критические значения для теста на уровне 5 % показаны вертикальными пунктирными оранжевыми линиями; красные линии (дальше) для теста на уровне 1%.