ทำไม $p$- ค่าบ่งชี้ว่าเข้ากันไม่ได้กับค่าว่าง?
ลองมาเป็นตัวอย่างง่ายๆการทดสอบสมมติฐานตัวอย่างสองด้านเกี่ยวกับค่าเฉลี่ยประชากร สมมติว่าเราได้พิจารณาไฟล์$\alpha$- ระดับเบื้องต้น
ปล่อย $X_1, \dots, X_n \overset{\text{iid}}{\sim}\mathcal{N}(\mu, \sigma^2)$. ในการตั้งค่านี้ให้ค่า$\mu_0$เรามีสมมติฐานว่างและสมมติฐานทางเลือก $H_0: \mu = \mu_0$ และ $H_1: \mu \neq \mu_0$.
ปล่อย $\bar{X}_n$ เป็นค่าเฉลี่ยตัวอย่างของ $X_1, \dots, X_n$ และ $S^2$ เป็นผู้ประมาณค่าที่เป็นกลางของ $\sigma^2$กับ $\bar{x}_n$ และ $s^2$ เป็นค่าที่สังเกตได้
เรารู้ว่า $$\dfrac{\bar{X}_n - \mu}{\sqrt{S^2/n}} \sim t_{n-1}$$ กล่าวคือก $t$- แจกจ่ายด้วย $n-1$ระดับความอิสระ. ภายใต้$H_0$เรามีสิ่งนั้น $$\dfrac{\bar{X}_n - \mu_0}{\sqrt{S^2/n}} \sim t_{n-1}\text{.}$$ จากนั้นเราคำนวณ a $p$- มูลค่า $$p = \mathbb{P}\left(|T| \geq \dfrac{\bar{x}_n - \mu_0}{\sqrt{s^2/n}} \right)$$ ที่ไหน $T \sim t_{n-1}$ และถ้า $p < \alpha$เราปฏิเสธ $H_0$ และระบุว่ามีหลักฐานสำหรับ $H_1$.
ตอนนี้ฉันทำตามขั้นตอนนี้มาหลายปีแล้วและฉันรู้สึกอายเล็กน้อยที่จะถามสิ่งนี้เนื่องจากฉันสำเร็จการศึกษาระดับปริญญาโท: แต่ทำไมถึงมี$p < \alpha$ แสดงว่าเข้ากันไม่ได้กับ $H_0$ และหลักฐานสำหรับ $H_1$เหรอ? ในทางคณิตศาสตร์สิ่งที่อยู่ในตอนท้ายของวันคือความน่าจะเป็นที่ตัวแปรสุ่มของคุณ$T$รับค่าอย่างน้อยที่สุด (ในค่าสัมบูรณ์) มากกว่าค่าที่ได้จากตัวอย่าง แต่ฉันไม่เห็นว่าทำไมต้องมี$p < \alpha$ แสดงว่าเรามีหลักฐานที่จะปฏิเสธ $H_0$.
บางทีสิ่งนี้อาจครอบคลุมใน Casella และ Berger และฉันลืมรายละเอียดไปแล้ว
คำตอบ
ลองใช้การเปรียบเทียบ
คุณตื่นขึ้นมาอย่างสับสนว่ามันคือวันอะไร ที่แย่กว่านั้นคือคุณไม่รู้เดือนด้วยซ้ำแม้ว่าคุณจะมีลางสังหรณ์ว่าอาจเป็นฤดูร้อน แต่คุณก็อยากให้เป็นฤดูหนาว (ดังนั้น$H_0: \text{summer}$ และ $H_a: \text{winter}$). คุณไม่เชื่อถือปฏิทินในโทรศัพท์ของคุณ แต่คุณเชื่อถือแอปพยากรณ์อากาศดังนั้นคุณจึงตรวจสอบอุณหภูมิ
คุณจะเห็นว่าแอพพยากรณ์อากาศรายงานอุณหภูมิเป็น $-24^{\circ} C$.
คุณรู้ดีว่าการที่อากาศหนาวจัดหรือหนาวจัดนั้นไม่น่าเกิดขึ้นในช่วงฤดูร้อนดังนั้นคุณจึงปฏิเสธความคิดที่ว่าฤดูร้อนเพื่อสรุปว่าเป็นฤดูหนาว
ในการเปรียบเทียบนี้ค่าวิกฤตให้น้อยเพียงพอ $p <\alpha$ คืออุณหภูมิที่คุณจะสงสัยลางสังหรณ์ของตัวเองว่ามันเป็นฤดูร้อนหรือเปล่าคุณจะสรุปว่า "ไม่ฤดูหนาว!"
ฉันมักจะเห็นค่า p เป็นตัวบ่งชี้ความผิดปกตินั่นคือการสังเกตที่ไม่น่าจะเกิดขึ้นได้มากนัก (ค่า p-value ระบุ)
ความแตกต่างระหว่างทฤษฎีโมฆะและการสังเกตไม่ได้เป็นตัวบ่งชี้ที่ชัดเจนของความไม่ลงรอยกันกับโมฆะ เนื่องจากสัญญาณรบกวนหรือการวัดรูปแบบอื่น ๆ จึงคาดว่าจะมีความคลาดเคลื่อนบางประการและมีแนวโน้มว่าจะได้รับการสังเกตภายในบางช่วง
อย่างไรก็ตามความคลาดเคลื่อนขนาดใหญ่นอกช่วงที่เป็นไปได้นั้นไม่คาดคิด ความคลาดเคลื่อนดังกล่าวเป็นตัวบ่งชี้ว่าทฤษฎีว่างอาจไม่ถูกต้อง ความคลาดเคลื่อนที่ไม่คาดคิดยิ่งมากขึ้น (ค่า p-value ยิ่งต่ำ) ก็จะยิ่งแสดงว่าทฤษฎีว่างไม่เข้ากันกับการสังเกต
เมื่อทดสอบทฤษฎีโดยดูความแตกต่างระหว่างทฤษฎีและการสังเกตโดยทั่วไปเราจะสนใจเฉพาะความคลาดเคลื่อนที่ไม่น่าจะเกิดขึ้นได้มากเท่านั้น
พูดอย่างเคร่งครัดp -valueคือหลักฐานบางอย่างเกี่ยวกับ$H_0$ เทียบกับ $H_1$คำถาม. โดยปกติแล้วจะทำให้เกิดการตัดสินใจ: คุณควรทำ (หรือวางแผนการกระทำในอนาคตของคุณ) โดยสมมติว่า$H_0$ เป็นเรื่องจริงหรือคุณควรถือ $H_1$จริงหรือ? ในสนามเชิงประจักษ์คุณไม่มีทางรู้ได้อย่างแน่นอน แต่ถึงกระนั้นคุณต้องตัดสินใจอย่างใดอย่างหนึ่ง
ตอนนี้มันเป็นคำถามที่แตกต่างกันว่าความน่าจะเป็นเป็นเกณฑ์ที่ถูกต้องสำหรับการตัดสินใจนั้นหรือไม่ แต่ให้เราสมมติว่ามันเป็น จากนั้นโดยการตั้งค่า$\alpha$ถึงค่าบางค่า (โดยปกติคือ 0.05) คุณกำลังกำหนดขอบเขตการตัดสินใจโดยทั่วไป: ถ้าp -valueอยู่ต่ำกว่านั้นคุณตัดสินใจที่จะทำราวกับว่า$H_1$เป็นความจริงเพราะมันไม่น่าจะเป็นไปได้เพียงพอ (แม้ว่าจะยังคงเป็นไปได้) ที่จะได้รับค่าที่สูงส่งเช่นนี้$T$ ถ้า $H_0$ พูดถูก
ตัวอย่างเช่น:
สมมติว่าคุณสั่ง 1 ล้าน 1 k$\Omega$ตัวต้านทานจากผู้ผลิตชิ้นส่วนอิเล็กทรอนิกส์ เนื่องจากกระบวนการผลิตไม่มีตัวต้านทานใดที่เท่ากับ 1 k$\Omega$ดังนั้นความต้านทานที่แท้จริงคือการแจกแจงแบบสุ่มรอบ ๆ ค่านั้น คุณไม่มีทรัพยากรในการตรวจสอบตัวต้านทานแต่ละตัวด้วยตัวเอง แต่คุณสามารถหาตัวอย่างวัดความต้านทานและทำสถิติได้
ถ้าคุณได้รับมากพอพี -value,$p \gt \alpha$, คุณสามารถพูดได้:
สมมติว่าความต้านทานที่แท้จริงในประชากรคือ 1$k\Omega$มีความเป็นไปได้สูงพอสมควรที่จะวาดตัวอย่างสุ่มที่ความต้านทานเฉลี่ยเบี่ยงเบนอย่างน้อยที่สุดเท่าที่วัดได้จากค่าอุดมคตินั้น ฉันจะยอมรับการจัดส่งและสร้างตัวต้านทานในผลิตภัณฑ์ของฉัน
นี่คือความล้มเหลวในการปฏิเสธ $H_0$. ในทางกลับกันหากค่าpของคุณต่ำกว่า$\alpha$เหตุผลของคุณมีดังต่อไปนี้:
สมมติว่าความต้านทานที่แท้จริงในประชากรคือ 1$k\Omega$เป็นไปไม่ได้มากที่จะสุ่มตัวอย่างที่ความต้านทานเฉลี่ยเบี่ยงเบนไปอย่างน้อยที่สุดเท่าที่วัดได้จากค่าอุดมคตินั้น ดังนั้นความต้านทานที่แท้จริงน่าจะไม่ใช่ 1$k\Omega$. ฉันจะปฏิเสธการจัดส่งฟ้องผู้ผลิตค้นหาตัวต้านทานที่น่าเชื่อถือกว่าหรืออะไรก็ตาม แต่ฉันจะไม่ใช้ตัวต้านทานเหล่านี้ในผลิตภัณฑ์ของฉันเพราะมันจะไม่ทำงานอย่างถูกต้องกับส่วนประกอบที่มีขนาดไม่ถูกต้อง
นี่คือการปฏิเสธ $H_0$ ในความโปรดปรานของ $H_1$.