Diğer yordayıcıları R'de simülasyon yoluyla sabit tutmak
salary
Bazı profesörlerin yıllara dayanan deneyimlerinden ( time
) yayın sayısını kontrol etme / sabit tutma ( ) ile ilgili tahminde bulunduğunuzu hayal edin pubs
.
Soru: ilgili şu mı sabiti tutan anlamı sayılarını
pubs
doğru ve kanıtlanabilir simulasyon yoluylaR
?
Sayısız profesörümüz olduğunu hayal edin, sonra onlardan tam olarak aynı sayıda pubs
(örn.$1$).
- Bir regresyon modelini yalnızca
time
öngörücü olarak yerleştirin, regresyon katsayısını alıntime
. - Başka örneği alın
pubs
ve$2$, Regresyon modelini tekrar uydurun, regresyon katsayısını alıntime
. - Değişen tutun
pubs
için$3, 4,…$ve her seferinde regresyon katsayısını alıntime
.
Sonunda, ortalama bizim regresyon coefs arasında time
bir olacaktır kısmi regresyon katsayısı kontrollü etti pubs
profesörlerin tahmin ederken salary
gelen time
.
ps Bir tahminciyi kontrol etmek, onu entegre etmeye benzer mi?
Yanıtlar
Evet, model doğru belirtilmişse .
Verilerinizin şu şekilde oluşturulduğunu varsayalım: $$ y = \beta_1 x_1 + \beta_2 x_2 + \epsilon, \mbox{ where } E[\epsilon|x_1, x_2] = 0, $$ yani $$ E[y|x_1, x_2] = \beta_1 x_1 + \beta_2 x_2. $$ Varsayalım $x_1$ ilginin habercisidir ve $x_2$kontroldür. Kontrolde koşullandırma$x_2$ verir $$ E[y|x_2] = \beta_1 E[x_1|x_2] + \beta_2 x_2. \quad (*) $$
Ampirik karşılığı $(*)$ önerdiğiniz gerileme --- gerileme $y$ açık $x_1$ (kesişme ile) belirli bir değer için $x_2$. Verilen herhangi bir değer için$x_2$, bu regresyon koşullu $x_2$ zaten tarafsız bir tahmincidir $\beta_1$.
Ortalama üzerinde $x_2$tahmini daha az gürültülü hale getirir. Varsayım$E[\epsilon|x_1, x_2] = 0$ örneklerin birbiriyle ilintisiz olduğunu ima eder $x_2$. Bu nedenle ortalama$x_2$ daha küçük bir standart hata verir.
Yorum Yap
"Gerileme koşullu $x_2$ tarafsız bir tahmincidir $\beta_1$"doğru spesifikasyona bağlıdır - doğru fonksiyonel form / ihmal edilen değişken yok / vb. Gerçek bir veri setinde, gerçek fonksiyonel formun doğrusal olduğuna / kontrollerin ihmal edilmediğine / vb. inanmaya / iddia etmeye istekli olmanız gerekir.
Gerçek popülasyon regresyon fonksiyonu doğrusal değilse $E[\epsilon|x_1, x_2] = 0$ hala geçerli, OLS katsayısının ortalamasının alınmasını bekliyorum $x_1$ regresyon koşullu $x_2$, Bunu aramak $\hat{\beta}_1|x_2$, bitmiş $x_2$ OLS katsayısına yakın olmak $\hat{\beta}_1$.