어떻게 $t$-통계를 사용하여 가설을 테스트합니까?
다음 질문이 있습니다. 정규 분포에서 크기 25의 무작위 표본은 평균 47과 표준 편차 7을 갖습니다. $t$-통계, 주어진 정보가 인구 평균이 42라는 추측을 뒷받침한다고 말할 수 있습니까?
정말 혼란 스러워요 $t$-통계는 가설을 거부하거나 거부하는 데 실패합니다. 설명이 정말 도움이 될 것입니다. 감사!
답변
양면 단 표본 T 검정
그냥 우연히 정상적인 데이터 세트가 $n=25, \bar X = 57, S = 7$ 내 R 세션 창에서.
데이터가 테스트에 적합합니까? 다음은 R로 계산 된 데이터 요약입니다.
summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
35.18 40.78 44.83 47.00 52.35 61.34
length(x); sd(x)
[1] 25 # sample size n = 25
[1] 7 # sample standard deviation S = 7.0
stripchart(x, pch="|")
먼 이상 치가없는 거의 대칭적인 데이터입니다. P- 값이 위의 Shapiro-Wilk 정규성 테스트를 통과합니다.$0.05 = 5\%.$
shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.96136, p-value = 0.4423
데이터는 테스트에서 유효하기에 충분히 정상에 가깝습니다.
t 테스트에 대한 R 출력. 따라서 다음은 다음의 1- 표본 t 검정에 대한 R의 출력입니다$H_0: \mu = 42$ 에 맞서 $H_a: \mu \ne 42.$
t.test(x, mu=42)
One Sample t-test
data: x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis:
true mean is not equal to 42
95 percent confidence interval:
44.11054 49.88946
sample estimates:
mean of x
47
출력 해석. P- 값은$0.0015 < 0.05 = 5\%,$ 그래서 당신은 거부 할 것입니다 $H_0$5 % 유의 수준에서. 1 % 수준에서 거부 할 수도 있습니다.
출력은 또한 95 % 신뢰 구간 (CI)을 제공합니다. $(44.11, 49.89),$ 그래서 우리는 진정한 가치 $\mu$그 간격에 - 않는 하지 포함$\mu = 42.$
이 CI에 대한 한 가지 해석은 데이터를 기반으로 한 "거부 불가능한"귀무 가설의 간격이라는 것입니다.
테스트에 대해 알아야 할 세부 정보입니다. @PeterForeman이 T- 통계를 계산하는 방법을 보여주었습니다. P- 값을 제외하고는 출력의 다른 모든 것을 수작업으로 재현 할 수 있어야합니다.
정확한 P- 값 은 컴퓨터 출력물에 제공됩니다. 보고 인쇄 테이블 t, 당신은 '브라켓'P 값으로 할 수 있어야한다. 예를 들어, 내 테이블에는 DF = 24 행에 2.467 및 3.745 값이 있으며, 이는 T- 통계 3.5714를 포함합니다. 테이블의 상단 여백을 보면 P- 값이$2(0.001) = 0.002$ 과 $2(0.0005) = 0.001,$R의 값과 일치합니다. [
2
s는 양면 t 검정이기 때문입니다.]R 또는 기타 통계 소프트웨어 에서이 양면 검정의 정확한 P- 값을 얻을 수 있습니다 . T 통계가 멀어 질 확률입니다.$0$ 관찰 된 것보다 $T =3.5714.$R에서
pt
스튜던트 t 분포의 CDF는 다음과 같이 계산하면 인쇄물의 P- 값에 매우 가깝습니다. (보고 된 T 통계의 값이 반올림되면 P- 값이 정확히 일치하지 않을 수 있지만 처음 몇 자리 만 의사 결정에 중요합니다.)
.
2 * (1 - pt(3.5714, 24))
[1] 0.001543522
- 의견에있는 질문 중 하나에 답하려면 : 인쇄 된 t 테이블 에서 5 % 수준에서 거부에 대한 임계 값이 다음 과 같다고 말할 수 있습니다.$c = 2.064.$ 즉, 5 % 수준에서 거부 할 것입니다. $|T| > 2.064,$그것은입니다. 임계 값은 확률을 줄입니다$0.025 = 2.5\% $DF = 24 인 스튜던트 t 분포의 상단 꼬리에서.
qt
은 분위수 함수 (역 CDF) 인 R에서 아래와 같이 5 % 임계 값을 얻을 수 있습니다. 1 % 유의 수준에서 검정의 임계 값은 얼마입니까?
${}$
qt(.975, 24)
[1] 2.063899
그래픽 요약. 아래 그림은 24 DF를 갖는 스튜던트 t 분포의 밀도 함수를 보여줍니다. 수직 파란색은 T- 통계의 관찰 된 값을 나타냅니다. P- 값은이 선의 오른쪽에있는 곡선 아래 영역의 두 배입니다. 5 % 수준의 테스트에 대한 하한 및 상한 임계 값은 주황색 점선으로 표시됩니다. 1 % 수준의 테스트를위한 빨간색 선 (더 멀리).