Cara menghitung var dari jumlah dua koefisien dalam regresi linier [duplikat]
Intinya setelah melakukan regresi pada tiga variabel,
$$ y = a_0 + a_1 \cdot x_1 + a_2 \cdot x_2 + a_3 \cdot x_3 $$
Saya ingin mencari varians $a_1+a_2$untuk mendapatkan CI. Secara logis, saya pikir saya bisa melakukannya
$$\text{Var}(a_1+a_2)=\text{Var}(a_1)+\text{Var}(a_2)+\text{Cov}(a_1,a_2)$$
dan menghitung kovariansi dua normal karena dari hasil model saya akan tahu mean dan varians $a_1$ dan $a_2$, dan mereka terdistribusi normal tanpa gejala.
- Saya terjebak pada cara mendapatkan kovariansi dari dua RV normal. Ada petunjuk?
- Apakah ada kode sederhana untuk menghitung ini dengan python atau R?
Jawaban
Anda dapat menggunakan vcov(model)
R untuk mencari matriks kovarians.
a = rnorm(100)
b = rnorm(100,1,1)
c = rnorm(100,2,2)
y = rnorm(100,3,1)
m1 = lm(y~a+b+c)
Asumsikan Anda memiliki model linier $y = \beta_1 \cdot a + \beta_2 \cdot b + \beta_3 \cdot c+\epsilon$ dimana $a, b, c$adalah regressor, maka Anda dapat menggunakan kode di atas untuk menyesuaikan model. Kemudian ketik saja vcov(m1)
, Anda bisa mendapatkan matriks varians-kovarians.
> vcov(m1)
(Intercept) a b c
(Intercept) 0.0236168925 0.0008928804 -0.0072752173 -0.0048195656
a 0.0008928804 0.0089417637 -0.0007706158 -0.0005058700
b -0.0072752173 -0.0007706158 0.0084035744 0.0002730054
c -0.0048195656 -0.0005058700 0.0002730054 0.0022051924
Kemudian Anda dapat menggunakan rumus biasa untuk mendapatkan CI.
btw: $\text{Var}[X+Y] = \text{Var}[X] + \text{Var}[Y] + 2 \cdot \text{Cov}[X,Y]$