Intuición detrás de la prueba de endogeneidad (la prueba de Hausman)

Nov 07 2020

Supongamos que tenemos el siguiente modelo de regresión simple (marco de series de tiempo) "

$$y_1=\beta_0+\beta_1 y_2+\beta_2 z_1 +\beta_3 z_2 +u,$$

dónde $z_1$ y $z_2$ son exógenos y $y_2$es exógena o endógena (esto es lo que queremos comprobar). Para determinar si$y_2$ es endógena, podemos aplicar la prueba de endogeneidad (prueba de Hausman), que sigue el siguiente procedimiento:

Estime la forma reducida para $y_2$, es decir, estime la siguiente ecuación:

$$y_2=\alpha_0+\alpha_1z_1+\alpha_2z_2+\alpha_3z_3+\alpha_4z_4+\nu,$$ dónde $z_3$ y $z_4$son instrumentos. Desde cada uno$z_j$ no está correlacionado con $u$, $y_2$ no está correlacionado con $u$ si y solo si $v$ no está correlacionado con $u$; esto es lo que queremos probar. La forma más sencilla de probar esto es incluir$v$ como regresor adicional en la eqaution estructural y para hacer un $t$ prueba, es decir, estima el modelo

$$y_1=\beta_0+\beta_1 y_2+\beta_2 z_1 +\beta_3 z_2 +\gamma_1\widehat\nu+error.$$No entiendo esta parte. Queremos determinar si$u$ y $\nu$ están correlacionados, pero cómo lo liberamos al incluir $\widehat \nu$en la ecuación estructural? Al hacerlo, estimamos el impacto de$\widehat \nu$ en $y_1$, en lugar de en $u$. Explique la intuición.

PD: Según tengo entendido, para determinar si $u$ y $\nu$ están correlacionados, podemos aplicar los siguientes pasos:

  • Estimar $\widehat u$ de la ecuación estructural,
  • Estimar $\widehat \nu$ de la eqaution reducida,
  • Regreso $\widehat u$ en $\widehat \nu$.

Respuestas

Jonathan Nov 08 2020 at 01:50

La ecuacion

$$ y_2 = \alpha_0 + \alpha_1z_1 + \alpha_2z_2 + \alpha_3z_3 + \alpha_4z_4 + v $$

se suele llamar la primera etapa . El fundamento de esta prueba es que si$z_3$ y $z_4$ son buenos instrumentos, entonces $\hat{v}$ contiene la variación potencialmente mala en $y_2$, es decir, la parte que podría ser endógena. Si puede excluir$\hat{v}$ de la ecuación estructural, no se puede rechazar que $y_2$ es exógena.

Su intuición no es mala, pero considérelo como comprobar la correlación entre $y_2$ y y $u$en lugar. Los residuos no están correlacionados con los regresores que los hicieron (si no está familiarizado con esta marca aquí ) por lo que la correlación entre$\hat{u}$ y $y_2$es cero por construcción. El mismo problema se aplica a la correlación entre$\hat{u}$ y $\hat{v}$.

Observe que la ecuación estructural que incluye $\hat{v}$devuelve la estimación de IV. Otra forma de entender esta prueba es que si interpretamos IV como OLS controlando por$\hat{v}$ y si podemos excluir $\hat{v}$ a partir de esta ecuación, podría decirse que es inaccesible controlar por $\hat{v}$; es decir, utilizar IV.

Sin embargo, tenga en cuenta que esta rara vez es una prueba relevante.

Primero, asume que el (los) instrumento (s) son buenos. En segundo lugar, si tiene un instrumento bueno (más o menos), la prueba podría no ser rechazada simplemente porque la estimación de IV no es muy precisa. En este caso, elegiría IV en lugar de OLS cualquier día de la semana, ya que probablemente haya alguna razón teórica para sospechar de endogeneidad.

Consulte también aquí para obtener más información sobre los buenos instrumentos.