SAS - Kiểm tra giả thuyết

Kiểm tra giả thuyết là việc sử dụng các thống kê để xác định xác suất một giả thuyết đã cho là đúng. Quy trình kiểm tra giả thuyết thông thường bao gồm bốn bước như hình dưới đây.

Bước 1

Xây dựng giả thuyết vô hiệu H0 (thông thường, các quan sát là kết quả của cơ hội thuần túy) và giả thuyết thay thế H1 (thông thường, các quan sát cho thấy một tác động thực sự kết hợp với một thành phần của biến đổi cơ hội).

Bước 2

Xác định một thống kê kiểm định có thể được sử dụng để đánh giá sự thật của giả thuyết vô hiệu.

Bước 3

Tính giá trị P, là xác suất mà thống kê thử nghiệm ít nhất có ý nghĩa như thống kê được quan sát sẽ thu được giả sử rằng giả thuyết rỗng là đúng. Giá trị P càng nhỏ thì bằng chứng chống lại giả thuyết vô hiệu càng mạnh.

Bước 4

So sánh giá trị p với giá trị ý nghĩa có thể chấp nhận được alpha (đôi khi được gọi là giá trị alpha). Nếu p <= alpha, mà tác động quan sát được có ý nghĩa thống kê, thì giả thuyết vô hiệu bị loại trừ và giả thuyết thay thế là hợp lệ.

Ngôn ngữ lập trình SAS có các tính năng để thực hiện nhiều loại kiểm định giả thuyết như hình dưới đây.

Kiểm tra Sự miêu tả SAS PROC
T-Test Phép thử t được sử dụng để kiểm tra xem giá trị trung bình của một biến có khác đáng kể so với giá trị được giả thuyết hay không. PROC TTEST
ANOVA Nó cũng được sử dụng để so sánh các phương tiện khi có một biến phân loại độc lập. Chúng tôi muốn sử dụng ANOVA một chiều khi thử nghiệm để xem liệu giá trị trung bình của biến phụ thuộc khoảng có khác nhau theo biến phân loại độc lập hay không. PROC ANOVA
Chi-Square Chúng tôi sử dụng mức độ phù hợp chi bình phương để đánh giá xem tần số của một biến phân loại có khả năng xảy ra do ngẫu nhiên hay không. Việc sử dụng kiểm định chi bình phương là cần thiết cho dù tỷ lệ của một biến phân loại có phải là một giá trị giả định hay không. PROC FREQ
Linear Regression Hồi quy tuyến tính đơn giản được sử dụng khi người ta muốn kiểm tra xem một biến dự đoán biến khác tốt như thế nào. Đa tuyến tính cho phép người ta kiểm tra xem nhiều biến dự đoán một biến quan tâm tốt như thế nào. Khi sử dụng nhiều hồi quy tuyến tính, chúng tôi cũng giả định rằng các biến dự báo là độc lập. PROC REG