Python - Giá trị P
Giá trị p là độ mạnh của một giả thuyết. Chúng tôi xây dựng giả thuyết dựa trên một số mô hình thống kê và so sánh tính hợp lệ của mô hình bằng cách sử dụng giá trị p. Một cách để lấy giá trị p là sử dụng T-test.
Đây là phép thử hai mặt đối với giả thuyết rỗng rằng giá trị kỳ vọng (trung bình) của một mẫu quan sát độc lập 'a' bằng giá trị trung bình tổng thể đã cho, popmean. Chúng ta hãy xem xét ví dụ sau.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
Chương trình trên sẽ tạo ra kết quả sau.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
So sánh hai mẫu
Trong các ví dụ sau, có hai mẫu, có thể đến từ cùng một hoặc từ phân bố khác nhau và chúng tôi muốn kiểm tra xem các mẫu này có cùng thuộc tính thống kê hay không.
ttest_ind- Tính T-test cho phương tiện của hai mẫu điểm độc lập. Đây là một phép thử hai phía đối với giả thuyết rỗng rằng hai mẫu độc lập có giá trị trung bình (kỳ vọng) giống hệt nhau. Thử nghiệm này giả định rằng các quần thể có các phương sai giống hệt nhau theo mặc định.
Chúng ta có thể sử dụng phép thử này, nếu chúng ta quan sát hai mẫu độc lập từ cùng một quần thể giống nhau hoặc khác nhau. Chúng ta hãy xem xét ví dụ sau.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
Chương trình trên sẽ tạo ra kết quả sau.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Bạn có thể kiểm tra tương tự với một mảng mới có cùng độ dài, nhưng với giá trị trung bình khác nhau. Sử dụng một giá trị khác trongloc và kiểm tra tương tự.