Mengapa kita harus menambah / mengurangi 1 dalam perhitungan nilai-p?
Saya telah melihat persamaan ini untuk menghitung nilai-p setelah tes Monte-Carlo.
\ begin {persamaan} P_ {upper} = \ frac {NGE + 1} {N_ {run} + 1} \ quad \ quad P_ {lower} = \ frac {NLE + 1} {N_ {run} + 1} \ akhir {persamaan}
Sumber: https://www.biomedware.com/files/documentation/clusterseer/MCR/Monte_Carlo.htm
di mana Nruns adalah jumlah total simulasi Monte Carlo, NGE adalah jumlah simulasi yang statistiknya lebih besar dari atau sama dengan statistik yang diamati, dan NLE adalah jumlah simulasi yang statistiknya lebih rendah dari atau sama dengan yang diamati statistik.
Dalam persamaan ini, 1 ditambahkan ke pembilang dan penyebut karena "statistik yang diamati termasuk dalam distribusi referensi".
Pertanyaan:
Apa sebenarnya artinya dan mengapa kita harus menambah / mengurangi 1?
Bahkan jika saya tidak menambah / mengurangi satu pun, saya masih mendapatkan nilai p yang signifikan. Oleh karena itu, manakah yang benar secara statistik?
Ada pemikiran tentang ini? Saya akan menghargai bantuan apa pun!
Jawaban
Secara umum, untuk kalkulasi nilai-p, pertama-tama kami menghasilkan distribusi statistik uji dan mengintegrasikan distribusi dari statistik uji yang "diamati" hingga tak terbatas (katakanlah untuk nilai-p atas). Perhatikan gambar di bawah ini. Ada dua hipotesis yang sedang diuji untuk beberapa nilai$\mu=1$ dan $\mu=0$. Pertama, integral dari nilai yang diamati hingga tak terbatas dihitung untuk histogram biru dan merah. Kemudian nilai p akan menjadi integral dari histogram merah dibagi dengan biru.
Dalam kasus Anda, alih-alih integral, jumlah total peristiwa (MC) diambil secara langsung dan +1 sesuai dengan penggabungan statistik uji yang diamati dalam jumlah total tersebut.