Rでのシミュレーションにより、他の予測子を一定に保つ
予測想像salary
経験年数からいくつかの教授の(time
)のために/一定の保持制御する出版物のその数を(pubs
)。
質問:正しい数を一定に保つことの意味に関して、次のことは、の
pubs
シミュレーションで実証できR
ますか?
数え切れないほどの教授がいたと想像してみてください。そして、まったく同じ数の教授のサンプルを取りますpubs
(たとえば、$1$)。
time
予測子としてのみ使用する回帰モデルを近似し、の回帰係数を取得しtime
ます。- 別のサンプルを取る
pubs
の$2$、回帰モデルを再度適合させ、の回帰係数を取得しtime
ます。 - に変更
pubs
し続ける$3, 4,…$毎回の回帰係数を取得しtime
ます。
最後に、の回帰係数の平均は、から予測しながら教授のを制御しtime
た部分回帰係数になります。pubs
salary
time
ps予測子を制御することは、それを統合することに似ていますか?
回答
はい、モデルが正しく指定されていれば可能です。
あなたのデータがによって生成されたとしましょう $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$ すなわち $$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ 仮定します $x_1$ 関心のある予測因子であり、 $x_2$コントロールです。コントロールの条件付け$x_2$ 与える $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$
の経験的対応物 $(*)$ あなたが提案している回帰です---回帰 $y$ オン $x_1$ (切片あり)与えられた値に対して $x_2$。の任意の値について注意してください$x_2$、この回帰は条件付き $x_2$ はすでにの不偏推定量です $\beta_1$。
平均化 $x_2$見積もりのノイズが少なくなります。仮定$E[\epsilon|x_1, x_2] = 0$ サンプルが全体で無相関であることを意味します $x_2$。したがって、平均化$x_2$ より小さな標準誤差を与えます。
コメント
ステートメント「条件付き回帰 $x_2$ の不偏推定量です $\beta_1$"は正しい仕様に依存します---正しい関数形式/省略された変数がないなど。実際のデータセットでは、真の関数形式が線形である/コントロールが省略されていないなどを信じる/主張する必要があります。
真の母集団回帰関数が線形ではないが $E[\epsilon|x_1, x_2] = 0$ まだ当てはまりますが、OLS係数の平均化を期待します $x_1$ 条件付き回帰から $x_2$、 あれを呼べ $\hat{\beta}_1|x_2$、以上 $x_2$ OLS係数に近くなる $\hat{\beta}_1$。