왜 작은 $p$-value는 null과의 비 호환성을 나타냅니다.

Aug 18 2020

간단한 예로서 모집단 평균에 대한 양측 단 표본 가설 검정을 살펴 보겠습니다. 우리가 결정했다고 가정합니다$\alpha$-선험적 수준.

허락하다 $X_1, \dots, X_n \overset{\text{iid}}{\sim}\mathcal{N}(\mu, \sigma^2)$. 이 설정에서 값이 주어지면$\mu_0$, 우리는 귀무 가설과 대립 가설을 가지고 있습니다. $H_0: \mu = \mu_0$$H_1: \mu \neq \mu_0$.

허락하다 $\bar{X}_n$ 표본 평균이된다 $X_1, \dots, X_n$$S^2$ 편향되지 않은 추정자 $\sigma^2$,와 함께 $\bar{x}_n$$s^2$ 관찰 된 값입니다.

우리는 알고 있습니다 $$\dfrac{\bar{X}_n - \mu}{\sqrt{S^2/n}} \sim t_{n-1}$$ 즉, $t$-배포 $n-1$자유도. 아래에$H_0$, 우리는 $$\dfrac{\bar{X}_n - \mu_0}{\sqrt{S^2/n}} \sim t_{n-1}\text{.}$$ 그런 다음 우리는 $p$-값 $$p = \mathbb{P}\left(|T| \geq \dfrac{\bar{x}_n - \mu_0}{\sqrt{s^2/n}} \right)$$ 어디 $T \sim t_{n-1}$ 그리고 만약 $p < \alpha$, 우리는 거부합니다 $H_0$ 그리고 증거가 있다고 진술하십시오 $H_1$.

지금, 나는 몇 년 동안이 절차를 완료했습니다, 나는 조금 내가 석사 학위를 보유 주어진이 물어 당황 해요 :하지만 이유를 정확하게 가진 않습니다$p < \alpha$ 비 호환성 표시 $H_0$ 그리고 증거 $H_1$? 수학적으로, 하루가 끝나면 랜덤 변수가$T$샘플에 의해 산출 된 것보다 최소한 극단 (절대 값)의 값을 취합니다. 하지만 나는 왜$p < \alpha$ 거부 할 증거가 있음을 나타냅니다. $H_0$.

아마도 이것은 Casella와 Berger에서 다루었을 수 있으며 세부 사항을 잊어 버렸습니다.

답변

8 Dave Aug 18 2020 at 14:55

비유를 사용합시다.

당신은 그것이 무슨 요일인지에 대해 혼란스러워합니다. 설상가상으로 한 달도 모르지만, 여름이 될 것 같은 예감은 있지만 겨울 이길 원합니다.$H_0: \text{summer}$$H_a: \text{winter}$). 휴대 전화의 캘린더를 신뢰하지 않지만 날씨 앱을 신뢰하므로 온도를 확인합니다.

날씨 앱이 온도를 다음과 같이보고하는 것을 볼 수 있습니다. $-24^{\circ} C$.

당신은 여름에 그렇게 춥거나 더 추워 질 가능성이 매우 낮다는 것을 알고 있기 때문에 그것이 겨울이라는 결론을 내리기 위해 여름이라는 생각을 거부합니다.

이 비유에서 충분히 작은 임계 값은 $p <\alpha$ 직감이 의심스러워서 "아닙니다, 겨울철!"

2 SextusEmpiricus Aug 18 2020 at 19:03

저는 항상 p- 값을 이상 현상 의 지표로 봅니다 . 예상치 못한 극단적 인 관찰 ( p- 값으로 표시 되는 가능성이 얼마나되는지)입니다.

null 이론과 관찰 사이의 모든 불일치가 null과의 비 호환성의 강력한 지표는 아닙니다. 노이즈 또는 측정의 다른 변형으로 인해 약간의 불일치가 예상되며 특정 범위 내에서 관찰 될 가능성이 있습니다.

그러나 가능한 범위를 벗어난 큰 불일치는 예상치 못한 것입니다. 이러한 불일치는 귀무 이론이 잘못되었을 수 있음을 나타내는 지표입니다. 예상치 못한 불일치 (p- 값이 낮을수록)가 강할수록 귀무 이론이 관측치와 호환되지 않음을 나타냅니다.

이론을 테스트 할 때 이론과 관찰 사이의 불일치를 살펴보면 일반적으로 가능성이 거의없는 불일치에만 관심이 있습니다.

1 IgorF. Aug 18 2020 at 16:00

엄밀히 말하면, 어떤 P는 - 값은 일부 에 대한 증거$H_0$$H_1$질문. 일반적으로 의사 결정으로 귀결됩니다. 다음을 가정하여 행동 (또는 미래의 행동을 계획)해야합니까?$H_0$ 사실이거나 당신은 $H_1$사실? 경험적 분야에서는 절대 확실하게 알 수 없지만 어떻게 든 결정을 내려야합니다.

이제 확률 자체가 그 결정을 내리는 데 올바른 기준인지 여부는 다른 질문입니다.하지만 그렇다고 가정합시다. 그런 다음 설정하여$\alpha$어떤 값 (보통 0.05)으로 기본적으로 결정 경계를 설정하는 것입니다. p 값이 그보다 낮 으면 다음과 같이 행동하기로 결정합니다.$H_1$그 와 같은 극단적 인 가치를 얻는 것은 (아직 가능하더라도 ) 충분히 가능성 이 없기 때문 입니다.$T$ 만약 $H_0$ 옳았다.

예를 들면 :

1k 중 1 백만을 주문했다고 가정합니다.$\Omega$전자 부품 제조업체의 저항기. 제조 공정으로 인해 정확히 1k가되는 저항은 없습니다.$\Omega$, 따라서 진정한 저항은 해당 값 주변의 임의 분포입니다. 각 저항을 직접 확인할 수있는 리소스는 없지만 샘플을 채취하여 저항을 측정하고 통계를 수행 할 수 있습니다.

충분히 큰 p- 값 을 얻으면$p \gt \alpha$, 다음과 같이 말할 수 있습니다.

인구 의 진정한 저항 이 1 이라고 가정하면$k\Omega$, 평균 저항이 적어도 이상적인 값에서 측정 된만큼 벗어나는 무작위 샘플 을 그리는 것이 합리적 입니다. 나는 선적을 수락하고 내 제품에 저항을 만들 것입니다.

이것은 거부하지 못했습니다. $H_0$. 반면에 귀하의 p- 값이 귀하의$\alpha$, 귀하의 추론은 다음과 같습니다.

인구 의 진정한 저항 이 1 이라고 가정하면$k\Omega$, 평균 저항이 이상적인 값에서 측정 된만큼 벗어나는 무작위 샘플 을 취하는 것은 매우 불가능 합니다. 따라서 진정한 저항은 1$k\Omega$. 나는 더 신뢰할 수있는 하나 또는 무엇이든 검색, 제조업체를 고소, 선적을 거부 할 수 있습니다,하지만 난 것입니다 하지 가 잘못 치수 구성 요소가 제대로 작동하지 않을 때문에, 내 제품에 이러한 저항을 사용합니다.

이것은 거부입니다 $H_0$ 찬성 $H_1$.