통계-적합도
그만큼 Goodness of Fit검정은 표본 데이터가 모집단 분포에 적합한 지 여부를 확인하는 데 사용됩니다. 모집단에는 정규 분포 또는 Weibull 분포가있을 수 있습니다. 간단히 말해서 샘플 데이터가 실제 모집단에서 찾을 것으로 예상되는 데이터를 올바르게 나타냄을 의미합니다. 통계학자는 일반적으로 다음 테스트를 사용합니다.
Chi-square
Kolmogorov-Smirnov
Anderson-Darling
Shipiro-Wilk
카이-제곱 검정
카이 제곱 검정은 적합도 검정에 가장 일반적으로 사용되며 이항 분포 및 푸 아송 분포와 같은 이산 분포에 사용되는 반면 Kolmogorov-Smirnov 및 Anderson-Darling 적합도 검정은 연속 분포에 사용됩니다. .
공식
어디-
$ {O_i} $ = 변수의 i 번째 수준에서 관찰 된 값.
$ {E_i} $ = i 번째 수준 변수의 기대 값.
$ {X ^ 2} $ = 카이 제곱 확률 변수.
예
한 장난감 회사가 축구 선수 장난감을 만듭니다. 카드의 30 %는 미드 필더, 60 %는 수비수, 10 %는 포워드라고 주장합니다. 무작위 샘플 100 개 장난감을 고려하면 50 명의 미드 필더, 45 명의 수비수, 5 명의 포워드가 있습니다. 0.05 수준의 중요성이 주어지면 회사의 주장을 정당화 할 수 있습니까?
Solution:
가설 결정
Null hypothesis $ H_0 $ -미드 필더, 수비수, 포워드 비율은 각각 30 %, 60 %, 10 %입니다.
Alternative hypothesis $ H_1 $ -귀무 가설의 비율 중 하나 이상이 거짓입니다.
자유도 결정
자유도, DF는 범주 형 변수의 수준 수 (k)에서 1을 뺀 것과 같습니다. DF = k-1입니다. 여기서 수준은 3입니다. 따라서
카이-제곱 검정 통계량 결정
p- 값 결정
P- 값은 자유도가 2 인 카이-제곱 통계 $ X ^ 2 $가 19.58보다 더 극단적 일 확률입니다. 카이-제곱 분포 계산기를 사용하여 $ {P (X ^ 2 \ gt 19.58) = 0.0001} $를 찾습니다.
결과 해석
P- 값 (0.0001)이 유의 수준 (0.05)보다 훨씬 작기 때문에 귀무 가설을 받아 들일 수 없습니다. 따라서 회사 주장은 유효하지 않습니다.