Wie berechnet man eine Var der Summe zweier Koeffizienten in linearer Regression? [Duplikat]
Im Wesentlichen nach Durchführung einer Regression für drei Variablen,
$$ y = a_0 + a_1 \cdot x_1 + a_2 \cdot x_2 + a_3 \cdot x_3 $$
Ich möchte Varianz für finden $a_1+a_2$CI zu bekommen. Logischerweise denke ich, dass ich es schaffen kann
$$\text{Var}(a_1+a_2)=\text{Var}(a_1)+\text{Var}(a_2)+\text{Cov}(a_1,a_2)$$
und kovarianz von zwei Normalen berechnen, weil ich aus den Modellergebnissen Mittelwert und Varianz von kennen würde $a_1$ und $a_2$und sie sind asymptotisch normalverteilt.
- Ich bin nicht sicher, wie ich die Kovarianz von zwei normalen Wohnmobilen erreichen kann. Irgendeine Anleitung?
- Gibt es einen einfachen Code, um dies in Python oder R zu berechnen?
Antworten
Sie können vcov(model)
in R verwenden, um die Kovarianzmatrix zu finden.
a = rnorm(100)
b = rnorm(100,1,1)
c = rnorm(100,2,2)
y = rnorm(100,3,1)
m1 = lm(y~a+b+c)
Angenommen, Sie haben ein lineares Modell $y = \beta_1 \cdot a + \beta_2 \cdot b + \beta_3 \cdot c+\epsilon$ wo $a, b, c$Sind die Regressoren, können Sie den obigen Code verwenden, um das Modell anzupassen. Dann geben Sie einfach ein vcov(m1)
, Sie können die Varianz-Kovarianz-Matrix erhalten.
> vcov(m1)
(Intercept) a b c
(Intercept) 0.0236168925 0.0008928804 -0.0072752173 -0.0048195656
a 0.0008928804 0.0089417637 -0.0007706158 -0.0005058700
b -0.0072752173 -0.0007706158 0.0084035744 0.0002730054
c -0.0048195656 -0.0005058700 0.0002730054 0.0022051924
Dann können Sie die gewöhnliche Formel verwenden, um das CI zu erhalten.
Übrigens: $\text{Var}[X+Y] = \text{Var}[X] + \text{Var}[Y] + 2 \cdot \text{Cov}[X,Y]$