Diğer yordayıcıları R'de simülasyon yoluyla sabit tutmak
salaryBazı profesörlerin yıllara dayanan deneyimlerinden ( time) yayın sayısını kontrol etme / sabit tutma ( ) ile ilgili tahminde bulunduğunuzu hayal edin pubs.
Soru: ilgili şu mı sabiti tutan anlamı sayılarını
pubsdoğru ve kanıtlanabilir simulasyon yoluylaR?
Sayısız profesörümüz olduğunu hayal edin, sonra onlardan tam olarak aynı sayıda pubs(örn.$1$).
- Bir regresyon modelini yalnızca
timeöngörücü olarak yerleştirin, regresyon katsayısını alıntime. - Başka örneği alın
pubsve$2$, Regresyon modelini tekrar uydurun, regresyon katsayısını alıntime. - Değişen tutun
pubsiçin$3, 4,…$ve her seferinde regresyon katsayısını alıntime.
Sonunda, ortalama bizim regresyon coefs arasında timebir olacaktır kısmi regresyon katsayısı kontrollü etti pubsprofesörlerin tahmin ederken salarygelen time.
ps Bir tahminciyi kontrol etmek, onu entegre etmeye benzer mi?
Yanıtlar
Evet, model doğru belirtilmişse .
Verilerinizin şu şekilde oluşturulduğunu varsayalım: $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$ yani $$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ Varsayalım $x_1$ ilginin habercisidir ve $x_2$kontroldür. Kontrolde koşullandırma$x_2$ verir $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$
Ampirik karşılığı $(*)$ önerdiğiniz gerileme --- gerileme $y$ açık $x_1$ (kesişme ile) belirli bir değer için $x_2$. Verilen herhangi bir değer için$x_2$, bu regresyon koşullu $x_2$ zaten tarafsız bir tahmincidir $\beta_1$.
Ortalama üzerinde $x_2$tahmini daha az gürültülü hale getirir. Varsayım$E[\epsilon|x_1, x_2] = 0$ örneklerin birbiriyle ilintisiz olduğunu ima eder $x_2$. Bu nedenle ortalama$x_2$ daha küçük bir standart hata verir.
Yorum Yap
"Gerileme koşullu $x_2$ tarafsız bir tahmincidir $\beta_1$"doğru spesifikasyona bağlıdır - doğru fonksiyonel form / ihmal edilen değişken yok / vb. Gerçek bir veri setinde, gerçek fonksiyonel formun doğrusal olduğuna / kontrollerin ihmal edilmediğine / vb. inanmaya / iddia etmeye istekli olmanız gerekir.
Gerçek popülasyon regresyon fonksiyonu doğrusal değilse $E[\epsilon|x_1, x_2] = 0$ hala geçerli, OLS katsayısının ortalamasının alınmasını bekliyorum $x_1$ regresyon koşullu $x_2$, Bunu aramak $\hat{\beta}_1|x_2$, bitmiş $x_2$ OLS katsayısına yakın olmak $\hat{\beta}_1$.