Tại sao chúng ta phải cộng / trừ 1 trong phép tính giá trị p?
Tôi đã thấy phương trình này để tính toán giá trị p sau một bài kiểm tra Monte-Carlo.
\ begin {method} P_ {upper} = \ frac {NGE + 1} {N_ {running} + 1} \ quad \ quad P_ {Lower} = \ frac {NLE + 1} {N_ {running} + 1} \ kết thúc {phương trình}
Nguồn: https://www.biomedware.com/files/documentation/clusterseer/MCR/Monte_Carlo.htm
trong đó Nruns là tổng số mô phỏng Monte Carlo, NGE là số mô phỏng mà thống kê đó lớn hơn hoặc bằng thống kê được quan sát và NLE là số mô phỏng mà thống kê đó thấp hơn hoặc bằng với thống kê được quan sát thống kê.
Trong phương trình này, 1 được thêm vào tử số và mẫu số vì "thống kê quan sát được bao gồm trong phân phối tham chiếu".
Câu hỏi:
Chính xác thì điều này có nghĩa là gì và tại sao chúng ta nên cộng / trừ 1?
Ngay cả khi tôi không thêm / bớt một, tôi vẫn nhận được một giá trị p đáng kể. Do đó, cái nào là chính xác về mặt thống kê?
Bất kỳ suy nghĩ về điều này? Tôi sẽ đánh giá cao bất kỳ sự giúp đỡ nào!
Trả lời
Nói chung, để tính toán giá trị p, trước tiên chúng tôi tạo ra một phân phối của thống kê thử nghiệm và tích hợp phân phối từ thống kê thử nghiệm "quan sát" cho đến vô cùng (giả sử đối với giá trị p trên). Hãy xem xét hình ảnh dưới đây. Có hai giả thuyết đang được thử nghiệm cho một số giá trị$\mu=1$ và $\mu=0$. Đầu tiên, tích phân từ giá trị quan sát đến vô cùng được tính cho cả biểu đồ màu xanh lam và màu đỏ. Khi đó giá trị p sẽ là tích phân của biểu đồ màu đỏ chia cho màu xanh lam.
Trong trường hợp của bạn, thay vì tích phân, tổng số sự kiện (của MC) được lấy trực tiếp và +1 tương ứng với sự kết hợp của thống kê thử nghiệm quan sát trong tổng số đó.