Cara menghitung var dari jumlah dua koefisien dalam regresi linier [duplikat]

Dec 30 2020

Intinya setelah melakukan regresi pada tiga variabel,

$$ y = a_0 + a_1 \cdot x_1 + a_2 \cdot x_2 + a_3 \cdot x_3 $$

Saya ingin mencari varians $a_1+a_2$untuk mendapatkan CI. Secara logis, saya pikir saya bisa melakukannya

$$\text{Var}(a_1+a_2)=\text{Var}(a_1)+\text{Var}(a_2)+\text{Cov}(a_1,a_2)$$

dan menghitung kovariansi dua normal karena dari hasil model saya akan tahu mean dan varians $a_1$ dan $a_2$, dan mereka terdistribusi normal tanpa gejala.

  1. Saya terjebak pada cara mendapatkan kovariansi dari dua RV normal. Ada petunjuk?
  2. Apakah ada kode sederhana untuk menghitung ini dengan python atau R?

Jawaban

1 Leafstar Dec 30 2020 at 10:52

Anda dapat menggunakan vcov(model)R untuk mencari matriks kovarians.

a = rnorm(100)
b = rnorm(100,1,1)
c = rnorm(100,2,2)
y = rnorm(100,3,1)
m1 = lm(y~a+b+c)

Asumsikan Anda memiliki model linier $y = \beta_1 \cdot a + \beta_2 \cdot b + \beta_3 \cdot c+\epsilon$ dimana $a, b, c$adalah regressor, maka Anda dapat menggunakan kode di atas untuk menyesuaikan model. Kemudian ketik saja vcov(m1), Anda bisa mendapatkan matriks varians-kovarians.

> vcov(m1)
              (Intercept)             a             b             c
(Intercept)  0.0236168925  0.0008928804 -0.0072752173 -0.0048195656
a            0.0008928804  0.0089417637 -0.0007706158 -0.0005058700
b           -0.0072752173 -0.0007706158  0.0084035744  0.0002730054
c           -0.0048195656 -0.0005058700  0.0002730054  0.0022051924

Kemudian Anda dapat menggunakan rumus biasa untuk mendapatkan CI.

btw: $\text{Var}[X+Y] = \text{Var}[X] + \text{Var}[Y] + 2 \cdot \text{Cov}[X,Y]$