Thống kê - Độ tốt của Fit
Các Goodness of Fitthử nghiệm được sử dụng để kiểm tra dữ liệu mẫu xem nó có phù hợp với phân bố của dân số hay không. Dân số có thể có phân phối chuẩn hoặc phân bố Weibull. Nói một cách đơn giản, nó có nghĩa là dữ liệu mẫu đại diện cho dữ liệu một cách chính xác mà chúng tôi đang mong đợi để tìm thấy từ dân số thực tế. Các thử nghiệm sau thường được các nhà thống kê sử dụng:
Chi-square
Kolmogorov-Smirnov
Anderson-Darling
Shipiro-Wilk
Kiểm định chi bình phương
Phép thử chi bình phương được sử dụng phổ biến nhất để kiểm tra độ tốt của phép thử độ vừa vặn và được sử dụng cho các phân phối rời rạc như phân phối nhị thức và phân phối Poisson, trong khi Kolmogorov-Smirnov và Anderson-Darling độ tốt của các phép thử phù hợp được sử dụng cho các phân phối liên tục .
Công thức
Ở đâu -
$ {O_i} $ = giá trị quan sát của biến cấp thứ i.
$ {E_i} $ = giá trị kỳ vọng của biến cấp thứ i.
$ {X ^ 2} $ = biến ngẫu nhiên chi bình phương.
Thí dụ
Một công ty đồ chơi chế tạo đồ chơi cầu thủ bóng đá. Nó tuyên bố rằng 30% số thẻ là tiền đạo, 60% hậu vệ và 10% là tiền đạo. Xét một mẫu ngẫu nhiên 100 đồ chơi có 50 trung vệ, 45 hậu vệ và 5 tiền đạo. Với mức ý nghĩa 0,05, bạn có thể biện minh cho tuyên bố của công ty không?
Solution:
Xác định giả thuyết
Null hypothesis $ H_0 $ - Tỷ lệ trung vệ, hậu vệ và tiền đạo tương ứng là 30%, 60% và 10%.
Alternative hypothesis $ H_1 $ - Ít nhất một trong các tỷ lệ trong giả thuyết rỗng là sai.
Xác định mức độ tự do
Bậc tự do, DF bằng số bậc (k) của biến phân loại trừ đi 1: DF = k - 1. Ở đây các bậc là 3. Như vậy
Xác định thống kê kiểm tra chi bình phương
Xác định giá trị p
Giá trị P là xác suất để một thống kê chi bình phương, $ X ^ 2 $ có 2 bậc tự do là cực trị hơn 19,58. Sử dụng Máy tính Phân phối Chi-Square để tìm $ {P (X ^ 2 \ gt 19,58) = 0,0001} $.
Giải thích kết quả
Vì giá trị P (0,0001) nhỏ hơn mức ý nghĩa (0,05) nên không thể chấp nhận giả thuyết vô hiệu. Do đó yêu cầu của công ty là không hợp lệ.