95% มีความเฉพาะเจาะจงสำหรับช่วงความเชื่อมั่นในทางใด?
ฉันตระหนักถึงความเข้าใจผิดที่ว่า "ช่วงความเชื่อมั่น 95% หมายความว่ามีโอกาส 95% ที่พารามิเตอร์จริงจะอยู่ในช่วงนี้" และการตีความที่ถูกต้องก็คือถ้าคุณสร้างช่วงความเชื่อมั่นเหล่านี้จาก การสุ่มตัวอย่างจากนั้น 95 ของช่วงความเชื่อมั่นควรมีพารามิเตอร์จริง
ใน https://www.econometrics-with-r.org/5-2-cifrc.htmlฉันเห็นสิ่งต่อไปนี้:

คำนี้ไม่ถูกต้องหรือไม่? ดูเหมือนว่าจะบอกว่ามูลค่าที่แท้จริงมีโอกาส 95% ที่จะอยู่ในช่วงความเชื่อมั่นนั้น ๆ
คำถามที่สองของฉันคือสมมติว่าคุณมีช่วงความเชื่อมั่น 95 ช่วงนี้ นอกเหนือจากการใช้ 95% เพื่อให้ได้คะแนน 1.96 Z แล้วยังมีอีก 95% ที่แสดงในช่วงความเชื่อมั่นนี้อย่างไร
คำตอบ
คำนี้ไม่ถูกต้องหรือไม่? ดูเหมือนว่าจะบอกว่ามูลค่าที่แท้จริงมีโอกาส 95% ที่จะอยู่ในช่วงความเชื่อมั่นนั้น ๆ
คุณต้องจำไว้ว่าในสถิติบ่อยครั้งพารามิเตอร์ที่คุณกำลังประมาณ (ในกรณีของคุณ $\beta_i$ค่าที่แท้จริงของสัมประสิทธิ์) ไม่ถือเป็นตัวแปรสุ่ม แต่เป็นจำนวนจริงคงที่ นั่นหมายความว่ามันไม่ถูกต้องที่จะพูดบางอย่างเช่น"$\beta_i$ อยู่ในช่วงเวลา $[a,b]$ ด้วย $95\%$ความน่าจะเป็น "เพราะ$\beta_i$ไม่ใช่ตัวแปรสุ่มดังนั้นจึงไม่มีการแจกแจงความน่าจะเป็น ความน่าจะเป็นของ$\beta_i$ อยู่ในช่วงเวลาอย่างใดอย่างหนึ่ง $100\%$ (ถ้าค่าคงที่ $\beta_i\in[a,b]$) หรือ $0\%$ (ถ้าค่าคงที่ $\beta_i\notin[a,b]$)
นั่นคือเหตุผลที่ "ช่วงความเชื่อมั่น 95% หมายความว่ามีโอกาส 95% ที่พารามิเตอร์จริงจะอยู่ในช่วงนี้" เป็นความเข้าใจที่ผิด
ในทางกลับกันขีด จำกัด ของช่วงความเชื่อมั่นนั้นเป็นตัวแปรสุ่มเนื่องจากคำนวณจากข้อมูลตัวอย่าง นั่นหมายความว่าถูกต้องที่จะพูด "ใน 95% ของกลุ่มตัวอย่างทั้งหมด$\beta_i$ อยู่ในช่วงความเชื่อมั่น 95% "ไม่ได้หมายความว่า $\beta_i$ มี $95\%$โอกาสที่จะอยู่ในช่วงเวลาหนึ่งหมายความว่าช่วงความเชื่อมั่นซึ่งแตกต่างกันสำหรับแต่ละตัวอย่างมี$95\%$ ความน่าจะเป็นที่จะตกลงมา $\beta_i$.
สังเกตว่าช่วงความเชื่อมั่นจะมี $\beta_i$ด้วยความน่าจะเป็น95% ก่อนที่จะสุ่มตัวอย่างข้อมูล หลังจากสุ่มตัวอย่างแล้วขอบของช่วงความเชื่อมั่นจะเป็นเพียงตัวเลขคงที่สองตัวไม่ใช่ตัวแปรสุ่มอีกต่อไปและใช้เหตุผลเดียวกันจากย่อหน้าแรก ฉันคิดว่าภาพต่อไปนี้ให้ภาพที่ดีสำหรับแนวคิดนี้:

ดังนั้นการใช้ถ้อยคำจึงถูกต้องตามความเป็นจริง
นอกเหนือจากการใช้ 95% เพื่อให้ได้คะแนน 1.96 Z แล้วยังมีอีก 95% ที่แสดงในช่วงความเชื่อมั่นนี้อย่างไร
คะแนน 1.96 Z เป็นสถานที่เดียวที่ 95% ปรากฏขึ้น หากคุณเปลี่ยนเป็นคะแนน Z ที่สอดคล้องกับ 85% คุณจะมีช่วงความเชื่อมั่น 85% ของสูตร
บางทีถ้าคุณเปลี่ยนข้อความเป็น:
" ลองนึกภาพว่าคุณทำการสุ่มตัวอย่างซ้ำภายใต้เงื่อนไขเดียวกันไปเรื่อย ๆ สำหรับการวาดแต่ละครั้งคุณจะคำนวณค่าประมาณพารามิเตอร์และข้อผิดพลาดมาตรฐานเพื่อคำนวณช่วงความเชื่อมั่น 95% [สูตรในรูปของคุณ] จากนั้นช่วงความเชื่อมั่น 95% นี้จะจับ พารามิเตอร์ประชากรที่แท้จริงใน 95% ของเวลาหากเป็นไปตามสมมติฐานทั้งหมดและสมมติฐานว่างเป็นจริง "
จะสมเหตุสมผลกว่านี้ไหม
สำหรับคำถามที่สองของคุณให้พิจารณาการแจกแจงปกติมาตรฐานด้านล่าง พื้นที่ทั้งหมดใต้เส้นโค้งเท่ากับ 1 หากคุณคิดว่าระดับนัยสำคัญเป็น 5% และแบ่งส่วนนี้ระหว่างหางแต่ละหาง (พื้นที่สีแดง) คุณจะเหลือ 95% ตรงกลาง ถ้าสมมุติฐานว่างเป็นจริงนี่คือพื้นที่ที่คุณจะไม่ปฏิเสธสมมติฐานว่างเนื่องจากคะแนน Z ใด ๆ ที่อยู่ในพื้นที่นั้นมีความเป็นไปได้ภายใต้สมมติฐานว่าง เฉพาะในกรณีที่คะแนน Z ของคุณตกอยู่ในพื้นที่สีแดงคุณจะปฏิเสธสมมติฐานว่างเนื่องจากตัวอย่างของคุณให้หลักฐานที่สำคัญกับสมมติฐานว่างหรือกล่าวอีกนัยหนึ่งว่าคุณน่าจะค้นพบ - ไชโย: D
ตอนนี้โดยการคูณคะแนน Z วิกฤตที่ +/- 1.96 (ในกรณีที่มีความเชื่อมั่น 95%) กับข้อผิดพลาดมาตรฐานของตัวอย่างที่คุณกำลังแปลช่วงเวลา 95% นี้กลับไปยังมาตราส่วนการวัดเดิม ดังนั้นแต่ละช่วงความเชื่อมั่นจะสอดคล้องกับการทดสอบสมมติฐานในมาตราส่วนการวัดของคุณตามที่แนะนำในประโยคสุดท้ายบนภาพของคุณ

95% conf.int.
หมายความว่ามีโอกาสเพียง 5% ที่ค่าเชิงประจักษ์ที่แท้จริงจะหลุดออกจากช่วงเวลานี้ กล่าวอีกนัยหนึ่งโอกาส 5% ของการบวกเท็จถ้า (และเมื่อ) คุณถือว่าช่วงนั้นเป็นความจริงพื้นดิน