R의 시뮬레이션을 통해 다른 예측 변수를 일정하게 유지
salary
수년간의 경험 ( time
) 을 통해 출판물 수 ( )를 제어 / 보유한 교수를 예측한다고 상상해보십시오 pubs
.
질문 : 정확한 수를 일정하게 유지 하는 의미에 관한 다음은
pubs
시뮬레이션을 통해 입증 할 수R
있습니까?
수많은 교수가 있었다고 상상해보세요. 그런 다음 정확히 같은 수 pubs
(예 :$1$).
time
예측 변수 로만 회귀 모델을 맞추고 회귀 계수를 구합니다time
.- 또 다른 샘플을 받아
pubs
의를$2$, 회귀 모델을 다시 맞추고 회귀 계수를 구합니다time
. - 계속 변경
pubs
에$3, 4,…$그리고 매번time
.
결국 우리 회귀 계수의 평균 은 에서 예측하는 동안 교수의를 제어 time
한 부분 회귀 계수 가 됩니다 .pubs
salary
time
추신 예측자를 통합하는 것과 유사한 제어 입니까?
답변
예, 모델이 올바르게 지정된 경우 .
데이터가 다음에서 생성되었다고 가정합니다. $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$ 즉 $$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ 가정 $x_1$ 관심의 예측 자이고 $x_2$통제입니다. 컨트롤 컨디셔닝$x_2$ 준다 $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$
의 경험적 대응 $(*)$ 당신이 제안하는 회귀입니다 --- 회귀 $y$ 의 위에 $x_1$ (절편 포함) 주어진 값에 대해 $x_2$. 주어진 값에 대해$x_2$,이 회귀는 $x_2$ 이미 편향되지 않은 평가자입니다. $\beta_1$.
평균 이상 $x_2$견적을 덜 시끄럽게 만듭니다. 가정$E[\epsilon|x_1, x_2] = 0$ 샘플이 서로 관련이 없음을 의미합니다. $x_2$. 따라서 평균 이상$x_2$ 더 작은 표준 오차를 제공합니다.
논평
문 "에 대한 회귀 조건 $x_2$ 편향되지 않은 추정량 $\beta_1$"은 올바른 사양에 따라 달라집니다 .-- 올바른 기능적 형식 / 생략 된 변수 없음 / 등. 실제 데이터 세트에서 진정한 기능적 형식은 선형이라고 믿거 나 주장해야합니다.
실제 모집단 회귀 함수가 선형이 아니라 $E[\epsilon|x_1, x_2] = 0$ 여전히 유지됩니다, 나는 OLS 계수의 평균을 기대할 것입니다. $x_1$ 회귀 조건부에서 $x_2$, 불러라 $\hat{\beta}_1|x_2$, 이상 $x_2$ OLS 계수에 가깝다 $\hat{\beta}_1$.