Python - Nilai-P
Nilai-p adalah tentang kekuatan hipotesis. Kami membangun hipotesis berdasarkan beberapa model statistik dan membandingkan validitas model menggunakan nilai-p. Salah satu cara untuk mendapatkan nilai p adalah dengan menggunakan uji-T.
Ini adalah uji dua sisi untuk hipotesis nol bahwa nilai yang diharapkan (mean) dari sampel pengamatan independen 'a' sama dengan mean populasi yang diberikan, popmean. Mari kita perhatikan contoh berikut.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
Program di atas akan menghasilkan keluaran sebagai berikut.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
Membandingkan dua sampel
Dalam contoh berikut, ada dua sampel, yang dapat berasal dari distribusi yang sama atau berbeda, dan kami ingin menguji apakah sampel ini memiliki properti statistik yang sama.
ttest_ind- Menghitung T-test untuk rata-rata dua sampel skor independen. Ini adalah pengujian dua sisi untuk hipotesis nol bahwa dua sampel independen memiliki nilai rata-rata (yang diharapkan) yang identik. Tes ini mengasumsikan bahwa populasi memiliki varian identik secara default.
Kami dapat menggunakan tes ini, jika kami mengamati dua sampel independen dari populasi yang sama atau berbeda. Mari kita perhatikan contoh berikut.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
Program di atas akan menghasilkan keluaran sebagai berikut.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Anda dapat menguji hal yang sama dengan array baru dengan panjang yang sama, tetapi dengan mean yang bervariasi. Gunakan nilai yang berbeda diloc dan uji yang sama.