เมื่อใช้ Linear Models ที่มีความแปรปรวนร่วมแบบสุ่มความสัมพันธ์แบบเพียร์สันเป็นตัวกำหนดการลดลงของความแปรปรวนที่เหลือหรือไม่

Aug 19 2020

โดยทั่วไปถ้าคุณมีการกระจายตัวแปรตามปกติ Y พร้อมความแปรปรวน $\sigma_Y^2$ ตัวบ่งชี้การรักษาและความแปรปรวนร่วมแบบสุ่มที่มีการกระจายตามปกติเช่นกันจากนั้นเมื่อประกอบแบบจำลองเชิงเส้นด้วย ML- ประมาณการความแปรปรวนที่เหลือจะเป็นสัดส่วนกับปัจจัย $(1-r^2)\cdot\sigma_Y^2$. จากนั้น$r^2$ ควรแสดงถึงค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันกำลังสองระหว่างตัวแปร $Y$ และตัวแปร $X$.

ถูกต้องหรือไม่ ยังคงใช้ความสัมพันธ์แบบเพียร์สันคือถ้าตัวแปรสุ่ม$X$ ไม่กระจายตามปกติ แต่จะกระจายแบบเอ็กซ์โพเนนเชียลหรือไบนารี?

มีใครช่วยเคลียร์ประเด็นเหล่านั้นกับฉันและอาจให้ข้อมูลอ้างอิงสำหรับการอ่านเพิ่มเติม

คำตอบ

BigBendRegion Aug 26 2020 at 18:10

แน่นอนว่าคุณยังสามารถใช้สหสัมพันธ์กำลังสองเป็น "$R^2$"สถิติที่ไม่เป็นไปตามปกติแม้ว่าจะไม่ใช่เรื่องปกติก็ตาม $Y$. การประมาณค่า ML อาจอยู่ในรูปแบบที่แตกต่างกันบางทีอาจไม่เกี่ยวข้องกับความสัมพันธ์ของเพียร์สันตัวอย่าง แต่ความสัมพันธ์ของตัวอย่างเพียร์สันธรรมดาจะยังคงเป็นการประมาณที่สอดคล้องกันโดยไม่มีอาการ

นี่คือเหตุผลว่าทำไมสหสัมพันธ์เพียร์สันกำลังสองที่แท้จริงจึงเป็น "$R^2$"สถิติแม้จะไม่เป็นปกติของ $X$ และ $Y$.

ประการแรกกฎของความแปรปรวนทั้งหมดระบุว่าถ้า $(X,Y)$ จะกระจายร่วมกับความแปรปรวน จำกัด จากนั้น

$$Var(Y) = Var\{f(X)\} + E\{\nu(X)\},$$

ที่ไหน

$$ f(x) = E(Y | X=x)$$

และ

$$ \nu(x) = Var(Y | X=x).$$

ตั้งแต่ $R^2$ ควรจะเป็นสัดส่วนของความแปรปรวนใน $Y$ ที่อธิบายโดย $X$, ความจริง $R^2$ สามารถกำหนดได้อย่างสมเหตุสมผลว่า

$$ R^2 = \frac{Var\{f(X)\}}{Var\{f(X)\} + E\{\nu(X)\}} = \frac{Var\{f(X)\}}{Var(Y)}. $$

ตอนนี้ภายใต้สมมติฐานเชิงเส้นตรงว่า $E(Y | X=x) = \beta_0 + \beta_1 x$เรามีสิ่งนั้น $$ \beta_1 = \frac{\sigma_{XY}}{\sigma^2_X} = \rho_{XY}\frac{\sigma_Y}{\sigma_X},$$

ที่ไหน

$$ \sigma_{XY} = E\{(Y-\mu_y)\}\{X-\mu_X)\}$$ คือความแปรปรวนร่วมระหว่าง $X$ และ $Y$และ $$ \rho_{XY} = \frac{\sigma_{XY}}{\sigma_X\sigma_Y}$$ คือความสัมพันธ์ระหว่าง $X$ และ $Y$.

ตอนนี้กลับไปใช้กฎแห่งความแปรปรวนทั้งหมดเป็นจริง $R^2$ ให้โดย

$$R^2 = \frac{Var\{f(X)\}}{Var(Y)} = \frac{Var\{\beta_0 + \beta_1 X\}}{\sigma^2_Y} = \frac{\beta_1^2 \sigma_X^2}{\sigma^2_Y} = \rho_{XY}^2.$$

คำถามถามเกี่ยวกับมากกว่าหนึ่ง $X$ซึ่งในกรณีนี้ความสัมพันธ์แบบเพียร์สันธรรมดาไม่ได้ให้ค่า $R^2$แม้จะอยู่ภายใต้สภาวะปกติ อย่างไรก็ตามอาร์กิวเมนต์ข้างต้นสรุปได้ง่ายเป็นหลาย$X$ ตัวแปรด้วยการนิยามใหม่ของค่าสัมประสิทธิ์สหสัมพันธ์ที่เกี่ยวข้องกับ $(X_1,X_2,\dots,Y)$เมทริกซ์ความแปรปรวนร่วม อีกครั้งไม่จำเป็นต้องมีความเป็นปกติ