Rでのシミュレーションにより、他の予測子を一定に保つ

Aug 16 2020

予測想像salary経験年数からいくつかの教授の(timeのために/一定の保持制御する出版物のその数を(pubs)。

質問:正しい数を一定に保つことの意味に関して、次のことは、のpubsシミュレーションで実証できRますか?

数え切れないほどの教授がいたと想像してみてください。そして、まったく同じ数の教授のサンプルを取りますpubs(たとえば、$1$)。

  • time予測子としてのみ使用する回帰モデルを近似し、の回帰係数を取得しtimeます。
  • 別のサンプルを取るpubs$2$、回帰モデルを再度適合させ、の回帰係数を取得しtimeます。
  • に変更pubsし続ける$3, 4,…$毎回の回帰係数を取得しtimeます。

最後に、の回帰係数の平均は、から予測しながら教授のを制御しtime部分回帰係数になります。pubssalarytime

ps予測子を制御することは、それを統合することにていますか?

回答

1 Michael Aug 17 2020 at 02:22

はい、モデルが正しく指定されていれば可能です。

あなたのデータがによって生成されたとしましょう $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$ すなわち $$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ 仮定します $x_1$ 関心のある予測因子であり、 $x_2$コントロールです。コントロールの条件付け$x_2$ 与える $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$

の経験的対応物 $(*)$ あなたが提案している回帰です---回帰 $y$ オン $x_1$ (切片あり)与えられた値に対して $x_2$。の任意の値について注意してください$x_2$、この回帰は条件付き $x_2$ はすでにの不偏推定量です $\beta_1$

平均化 $x_2$見積もりの​​ノイズが少なくなります。仮定$E[\epsilon|x_1, x_2] = 0$ サンプルが全体で無相関であることを意味します $x_2$。したがって、平均化$x_2$ より小さな標準誤差を与えます。

コメント

ステートメント「条件付き回帰 $x_2$ の不偏推定量です $\beta_1$"は正しい仕様に依存します---正しい関数形式/省略された変数がないなど。実際のデータセットでは、真の関数形式が線形である/コントロールが省略されていないなどを信じる/主張する必要があります。

真の母集団回帰関数が線形ではないが $E[\epsilon|x_1, x_2] = 0$ まだ当てはまりますが、OLS係数の平均化を期待します $x_1$ 条件付き回帰から $x_2$、 あれを呼べ $\hat{\beta}_1|x_2$、以上 $x_2$ OLS係数に近くなる $\hat{\beta}_1$