Python - P-Değeri
P değeri, bir hipotezin gücü ile ilgilidir. Bazı istatistiksel modellere dayanarak hipotez oluşturuyor ve modelin geçerliliğini p-değerini kullanarak karşılaştırıyoruz. P değerini elde etmenin bir yolu, T testi kullanmaktır.
Bu, bağımsız gözlemler 'a' örneğinin beklenen değerinin (ortalama) verilen popülasyon ortalamasına eşit olduğu boş hipotezi için iki taraflı bir testtir, popmean. Aşağıdaki örneği ele alalım.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
Yukarıdaki program aşağıdaki çıktıyı üretecektir.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
İki numunenin karşılaştırılması
Aşağıdaki örneklerde, aynı veya farklı dağılımdan gelebilecek iki örnek vardır ve bu örneklerin aynı istatistiksel özelliklere sahip olup olmadığını test etmek istiyoruz.
ttest_ind- İki bağımsız puan örneğinin ortalamaları için T-testini hesaplar. Bu, iki bağımsız örneğin aynı ortalama (beklenen) değerlere sahip olduğuna dair sıfır hipotezi için iki taraflı bir testtir. Bu test, popülasyonların varsayılan olarak aynı varyanslara sahip olduğunu varsayar.
Aynı veya farklı popülasyondan iki bağımsız örnek gözlemlersek bu testi kullanabiliriz. Aşağıdaki örneği ele alalım.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
Yukarıdaki program aşağıdaki çıktıyı üretecektir.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Aynısını, aynı uzunlukta, ancak farklı bir ortalama ile yeni bir dizi ile test edebilirsiniz. İçinde farklı bir değer kullanınloc ve aynısını test edin.