Wie berechnet man eine Var der Summe zweier Koeffizienten in linearer Regression? [Duplikat]

Dec 30 2020

Im Wesentlichen nach Durchführung einer Regression für drei Variablen,

$$ y = a_0 + a_1 \cdot x_1 + a_2 \cdot x_2 + a_3 \cdot x_3 $$

Ich möchte Varianz für finden $a_1+a_2$CI zu bekommen. Logischerweise denke ich, dass ich es schaffen kann

$$\text{Var}(a_1+a_2)=\text{Var}(a_1)+\text{Var}(a_2)+\text{Cov}(a_1,a_2)$$

und kovarianz von zwei Normalen berechnen, weil ich aus den Modellergebnissen Mittelwert und Varianz von kennen würde $a_1$ und $a_2$und sie sind asymptotisch normalverteilt.

  1. Ich bin nicht sicher, wie ich die Kovarianz von zwei normalen Wohnmobilen erreichen kann. Irgendeine Anleitung?
  2. Gibt es einen einfachen Code, um dies in Python oder R zu berechnen?

Antworten

1 Leafstar Dec 30 2020 at 10:52

Sie können vcov(model)in R verwenden, um die Kovarianzmatrix zu finden.

a = rnorm(100)
b = rnorm(100,1,1)
c = rnorm(100,2,2)
y = rnorm(100,3,1)
m1 = lm(y~a+b+c)

Angenommen, Sie haben ein lineares Modell $y = \beta_1 \cdot a + \beta_2 \cdot b + \beta_3 \cdot c+\epsilon$ wo $a, b, c$Sind die Regressoren, können Sie den obigen Code verwenden, um das Modell anzupassen. Dann geben Sie einfach ein vcov(m1), Sie können die Varianz-Kovarianz-Matrix erhalten.

> vcov(m1)
              (Intercept)             a             b             c
(Intercept)  0.0236168925  0.0008928804 -0.0072752173 -0.0048195656
a            0.0008928804  0.0089417637 -0.0007706158 -0.0005058700
b           -0.0072752173 -0.0007706158  0.0084035744  0.0002730054
c           -0.0048195656 -0.0005058700  0.0002730054  0.0022051924

Dann können Sie die gewöhnliche Formel verwenden, um das CI zu erhalten.

Übrigens: $\text{Var}[X+Y] = \text{Var}[X] + \text{Var}[Y] + 2 \cdot \text{Cov}[X,Y]$