R의 시뮬레이션을 통해 다른 예측 변수를 일정하게 유지

Aug 16 2020

salary수년간의 경험 ( time) 을 통해 출판물 수 ( )를 제어 / 보유한 교수를 예측한다고 상상해보십시오 pubs.

질문 : 정확한 수를 일정하게 유지 하는 의미에 관한 다음은 pubs시뮬레이션을 통해 입증 할 수 R있습니까?

수많은 교수가 있었다고 상상해보세요. 그런 다음 정확히 같은 수 pubs(예 :$1$).

  • time예측 변수 로만 회귀 모델을 맞추고 회귀 계수를 구합니다 time.
  • 또 다른 샘플을 받아 pubs의를$2$, 회귀 모델을 다시 맞추고 회귀 계수를 구합니다 time.
  • 계속 변경 pubs$3, 4,…$그리고 매번 time.

결국 우리 회귀 계수의 평균 은 에서 예측하는 동안 교수의를 제어 time부분 회귀 계수 가 됩니다 .pubssalarytime

추신 예측자를 통합하는 것과 유사한 제어 입니까?

답변

1 Michael Aug 17 2020 at 02:22

예, 모델이 올바르게 지정된 경우 .

데이터가 다음에서 생성되었다고 가정합니다. $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$$$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ 가정 $x_1$ 관심의 예측 자이고 $x_2$통제입니다. 컨트롤 컨디셔닝$x_2$ 준다 $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$

의 경험적 대응 $(*)$ 당신이 제안하는 회귀입니다 --- 회귀 $y$ 의 위에 $x_1$ (절편 포함) 주어진 값에 대해 $x_2$. 주어진 값에 대해$x_2$,이 회귀는 $x_2$ 이미 편향되지 않은 평가자입니다. $\beta_1$.

평균 이상 $x_2$견적을 덜 시끄럽게 만듭니다. 가정$E[\epsilon|x_1, x_2] = 0$ 샘플이 서로 관련이 없음을 의미합니다. $x_2$. 따라서 평균 이상$x_2$ 더 작은 표준 오차를 제공합니다.

논평

문 "에 대한 회귀 조건 $x_2$ 편향되지 않은 추정량 $\beta_1$"은 올바른 사양에 따라 달라집니다 .-- 올바른 기능적 형식 / 생략 된 변수 없음 / 등. 실제 데이터 세트에서 진정한 기능적 형식은 선형이라고 믿거 나 주장해야합니다.

실제 모집단 회귀 함수가 선형이 아니라 $E[\epsilon|x_1, x_2] = 0$ 여전히 유지됩니다, 나는 OLS 계수의 평균을 기대할 것입니다. $x_1$ 회귀 조건부에서 $x_2$, 불러라 $\hat{\beta}_1|x_2$, 이상 $x_2$ OLS 계수에 가깝다 $\hat{\beta}_1$.