Python-P- 값
p- 값은 가설의 강도에 대한 것입니다. 일부 통계 모델을 기반으로 가설을 만들고 p- 값을 사용하여 모델의 타당성을 비교합니다. p- 값을 얻는 한 가지 방법은 T- 검정을 사용하는 것입니다.
이것은 독립 관측 값 'a'의 기대 값 (평균)이 주어진 모집단 평균과 같다는 귀무 가설에 대한 양측 검정입니다. popmean. 다음 예를 살펴 보겠습니다.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
위의 프로그램은 다음과 같은 출력을 생성합니다.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
두 샘플 비교
다음 예에는 두 개의 샘플이 있는데, 이는 동일하거나 다른 분포에서 나올 수 있으며 이러한 샘플이 동일한 통계적 특성을 갖는지 테스트하려고합니다.
ttest_ind− 두 개의 독립적 인 점수 샘플의 평균에 대한 T- 검정을 계산합니다. 이것은 두 개의 독립적 인 표본이 동일한 평균 (예상) 값을 갖는다는 귀무 가설에 대한 양측 검정입니다. 이 검정은 기본적으로 모집단의 분산이 동일하다고 가정합니다.
동일하거나 다른 모집단에서 두 개의 독립적 인 표본을 관찰하는 경우이 검정을 사용할 수 있습니다. 다음 예를 살펴 보겠습니다.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
위의 프로그램은 다음과 같은 출력을 생성합니다.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
길이는 같지만 평균이 다른 새 배열로 동일하게 테스트 할 수 있습니다. 다른 값 사용loc 똑같이 테스트하십시오.