ทำไมเราจึงควรบวก / ลบ 1 ในการคำนวณค่า p?
ฉันได้เห็นสมการนี้สำหรับการคำนวณค่า p หลังจากการทดสอบมอนติคาร์โล
\ start {สมการ} P_ {upper} = \ frac {NGE + 1} {N_ {running} + 1} \ quad \ quad P_ {lower} = \ frac {NLE + 1} {N_ {run} + 1} \ จบ {สมการ}
ที่มา: https://www.biomedware.com/files/documentation/clusterseer/MCR/Monte_Carlo.htm
โดยที่ Nruns คือจำนวนการจำลองมอนติคาร์โลทั้งหมด NGE คือจำนวนการจำลองที่สถิติมากกว่าหรือเท่ากับสถิติที่สังเกตได้และ NLE คือจำนวนการจำลองที่สถิติต่ำกว่าหรือเท่ากับที่สังเกตได้ สถิติ.
ในสมการนี้ 1 จะถูกเพิ่มเข้าไปในตัวเศษและตัวส่วนเนื่องจาก "สถิติที่สังเกตได้รวมอยู่ในการแจกแจงอ้างอิง"
คำถาม:
สิ่งนี้หมายความว่าอย่างไรและเหตุใดเราจึงควรบวก / ลบ 1?
แม้ว่าฉันจะไม่บวก / ลบค่าหนึ่ง แต่ฉันก็ยังได้ p-value ที่สำคัญ ดังนั้นข้อใดถูกต้องตามสถิติ
มีความคิดเห็นเกี่ยวกับเรื่องนี้ไหม ฉันจะขอบคุณทุกความช่วยเหลือ!
คำตอบ
โดยทั่วไปสำหรับการคำนวณค่า p ขั้นแรกเราจะสร้างการแจกแจงของสถิติการทดสอบและรวมการแจกแจงจากสถิติการทดสอบ "สังเกต" ไปจนถึงอินฟินิตี้ (สมมติว่าสำหรับค่า p บน) พิจารณาภาพด้านล่าง มีสองสมมติฐานที่ถูกทดสอบสำหรับค่าบางอย่าง$\mu=1$ และ $\mu=0$. ประการแรกอินทิกรัลจากค่าที่สังเกตได้ถึงอินฟินิตี้จะคำนวณสำหรับทั้งฮิสโทแกรมสีน้ำเงินและสีแดง p-value จะเป็นส่วนประกอบของฮิสโตแกรมสีแดงหารด้วยสีน้ำเงิน
ในกรณีของคุณแทนที่จะใช้จำนวนอินทิกรัลจำนวนเหตุการณ์ทั้งหมด (ของ MC) โดยตรงและ +1 จะสอดคล้องกับการรวมสถิติการทดสอบที่สังเกตได้ในจำนวนทั้งหมดนั้น