Diğer yordayıcıları R'de simülasyon yoluyla sabit tutmak

Aug 16 2020

salaryBazı profesörlerin yıllara dayanan deneyimlerinden ( time) yayın sayısını kontrol etme / sabit tutma ( ) ile ilgili tahminde bulunduğunuzu hayal edin pubs.

Soru: ilgili şu mı sabiti tutan anlamı sayılarını pubsdoğru ve kanıtlanabilir simulasyon yoluyla R?

Sayısız profesörümüz olduğunu hayal edin, sonra onlardan tam olarak aynı sayıda pubs(örn.$1$).

  • Bir regresyon modelini yalnızca timeöngörücü olarak yerleştirin, regresyon katsayısını alın time.
  • Başka örneği alın pubsve$2$, Regresyon modelini tekrar uydurun, regresyon katsayısını alın time.
  • Değişen tutun pubsiçin$3, 4,…$ve her seferinde regresyon katsayısını alın time.

Sonunda, ortalama bizim regresyon coefs arasında timebir olacaktır kısmi regresyon katsayısı kontrollü etti pubsprofesörlerin tahmin ederken salarygelen time.

ps Bir tahminciyi kontrol etmek, onu entegre etmeye benzer mi?

Yanıtlar

1 Michael Aug 17 2020 at 02:22

Evet, model doğru belirtilmişse .

Verilerinizin şu şekilde oluşturulduğunu varsayalım: $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$ yani $$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ Varsayalım $x_1$ ilginin habercisidir ve $x_2$kontroldür. Kontrolde koşullandırma$x_2$ verir $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$

Ampirik karşılığı $(*)$ önerdiğiniz gerileme --- gerileme $y$ açık $x_1$ (kesişme ile) belirli bir değer için $x_2$. Verilen herhangi bir değer için$x_2$, bu regresyon koşullu $x_2$ zaten tarafsız bir tahmincidir $\beta_1$.

Ortalama üzerinde $x_2$tahmini daha az gürültülü hale getirir. Varsayım$E[\epsilon|x_1, x_2] = 0$ örneklerin birbiriyle ilintisiz olduğunu ima eder $x_2$. Bu nedenle ortalama$x_2$ daha küçük bir standart hata verir.

Yorum Yap

"Gerileme koşullu $x_2$ tarafsız bir tahmincidir $\beta_1$"doğru spesifikasyona bağlıdır - doğru fonksiyonel form / ihmal edilen değişken yok / vb. Gerçek bir veri setinde, gerçek fonksiyonel formun doğrusal olduğuna / kontrollerin ihmal edilmediğine / vb. inanmaya / iddia etmeye istekli olmanız gerekir.

Gerçek popülasyon regresyon fonksiyonu doğrusal değilse $E[\epsilon|x_1, x_2] = 0$ hala geçerli, OLS katsayısının ortalamasının alınmasını bekliyorum $x_1$ regresyon koşullu $x_2$, Bunu aramak $\hat{\beta}_1|x_2$, bitmiş $x_2$ OLS katsayısına yakın olmak $\hat{\beta}_1$.