통계-적합도

그만큼 Goodness of Fit검정은 표본 데이터가 모집단 분포에 적합한 지 여부를 확인하는 데 사용됩니다. 모집단에는 정규 분포 또는 Weibull 분포가있을 수 있습니다. 간단히 말해서 샘플 데이터가 실제 모집단에서 찾을 것으로 예상되는 데이터를 올바르게 나타냄을 의미합니다. 통계학자는 일반적으로 다음 테스트를 사용합니다.

Chi-square
Kolmogorov-Smirnov
Anderson-Darling
Shipiro-Wilk

카이-제곱 검정

카이 제곱 검정은 적합도 검정에 가장 일반적으로 사용되며 이항 분포 및 푸 아송 분포와 같은 이산 분포에 사용되는 반면 Kolmogorov-Smirnov 및 Anderson-Darling 적합도 검정은 연속 분포에 사용됩니다. .

공식

$ {X ^ 2 = \ sum {[\ frac {(O_i-E_i) ^ 2} {E_i}]}} $

어디-

$ {O_i} $ = 변수의 i 번째 수준에서 관찰 된 값.
$ {E_i} $ = i 번째 수준 변수의 기대 값.
$ {X ^ 2} $ = 카이 제곱 확률 변수.

예

한 장난감 회사가 축구 선수 장난감을 만듭니다. 카드의 30 %는 미드 필더, 60 %는 수비수, 10 %는 포워드라고 주장합니다. 무작위 샘플 100 개 장난감을 고려하면 50 명의 미드 필더, 45 명의 수비수, 5 명의 포워드가 있습니다. 0.05 수준의 중요성이 주어지면 회사의 주장을 정당화 할 수 있습니까?

Solution:

가설 결정

Null hypothesis $ H_0 $ -미드 필더, 수비수, 포워드 비율은 각각 30 %, 60 %, 10 %입니다.
Alternative hypothesis $ H_1 $ -귀무 가설의 비율 중 하나 이상이 거짓입니다.

자유도 결정

자유도, DF는 범주 형 변수의 수준 수 (k)에서 1을 뺀 것과 같습니다. DF = k-1입니다. 여기서 수준은 3입니다. 따라서

$ {DF = k-1 \\ [7pt] \, = 3 -1 = 2} $

카이-제곱 검정 통계량 결정

$ {X ^ 2 = \ sum {[\ frac {(O_i-E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}] + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13.33 + 3.75 + 2.50 \\ [7pt] \, = 19.58} $

p- 값 결정

P- 값은 자유도가 2 인 카이-제곱 통계 $ X ^ 2 $가 19.58보다 더 극단적 일 확률입니다. 카이-제곱 분포 계산기를 사용하여 $ {P (X ^ 2 \ gt 19.58) = 0.0001} $를 찾습니다.

결과 해석

P- 값 (0.0001)이 유의 수준 (0.05)보다 훨씬 작기 때문에 귀무 가설을 받아 들일 수 없습니다. 따라서 회사 주장은 유효하지 않습니다.