¿Es este un uso apropiado de la diferencia en las diferencias?

Nov 08 2020

Aquí está la situación:

  • Hubo una intervención $T$.
  • Me interesa cómo esta intervención cambió los minutos dedicados a usar una computadora en 5 condados: $C_{a,t}, C_{b,t}, C_{c,t}, C_{d,t}, C_{e,t}$
  • Tengo datos diarios previos / posteriores sobre los minutos / gastados usando una computadora en 200 personas de estos 5 condados
  • Además, encontré grupos de 'control' para cada uno de los 5 condados de tratamiento que mostraban tendencias similares a un condado específico: $C_{a,c}, C_{b,c}, C_{c,c}, C_{d,c}, C_{e,c}$
  • También tengo datos diarios previos / posteriores a los minutos / gastados usando una computadora en 200 personas de estos 5 condados

Mi pregunta es: ¿debo tener en cuenta el hecho de que existen diferentes condados además del uso de efectos fijos? En otras palabras, espero que el efecto del tratamiento sea el MISMO en los 5 condados.

Esto es lo que estaba pensando. Esto se estima a nivel individual (i) y día (t):

$Y_{it} = \alpha_{it} + \beta T_{it} + \gamma t_{it} + \delta (T_{it} · t_{it}) + C_{it} + \epsilon_{it}$

Dónde

  • $\alpha$ = término constante
  • $\beta$ = efecto específico del grupo de tratamiento
  • $\gamma$ = tendencia temporal común a los grupos de control y tratamiento
  • $\delta$ = efecto real del tratamiento
  • $C$ = efecto fijo para el condado

¿Es esta una estimación precisa del efecto del tratamiento?

Respuestas

1 ThomasBilach Nov 09 2020 at 02:34

La parte confusa de su ecuación, al menos para mí, es su inclusión de un efecto fijo de condado y una variable de tratamiento a nivel individual . Déjame explicarlo. Aquí está su ecuación de diferencias en diferencias (DiD) (Nota: cambié la variable$t_{it}$ para $P_{t}$ya que es más agradable para los ojos y generalmente denota un indicador posterior al tratamiento que es invariante en la unidad):

$$ y_{ict} = α + \beta T_{i} + \gamma P_{t} + \delta(T_{i} \times P_{t}) + C_{c} + \epsilon_{ict}, $$

donde observas el resultado $y_{ict}$ para el individuo $i$ dentro del condado $c$ a través de los días $t$. Según tu publicación,$\alpha$es una constante (es decir, una intersección global) y no debe incluirse en un subíndice; no varía con el tiempo ni entre individuos.$T_{i}$es un maniquí de tratamiento para individuos tratados ; debería ser igual a 1 para las 200 personas tratadas en los cinco condados diferentes, 0 en caso contrario.$P_{t}$es un indicador postratamiento igual a 1 para todos los días posteriores al inicio del tratamiento en los grupos de tratamiento y control, 0 en caso contrario. A menos que haya entendido mal su ecuación, también querrá estimar los efectos fijos del condado . Si es así, debería ser$c$-suscripto. No debería cambiar nada con respecto a sus estimaciones de puntos. Ejecutar la ecuación anterior en el software, como está, devolverá una estimación de$\delta$. Sin embargo, el efecto de su condado se eliminará ya que es colineal con la variable ficticia de tratamiento. Tu estimación de$\delta$ permanecerá sin cambios.

Pero veamos si podemos mejorar su enfoque. Dado que observa a los mismos individuos antes y después del tratamiento, puede estimar una ecuación DiD utilizando efectos fijos individuales . Su tratamiento parece estar bien definido a nivel individual. Esto es lo que creo que debes hacer:

$$ y_{it} = α_{i} + \beta T_{i} + \gamma P_{t} + \delta(T_{i} \times P_{t}) + \theta X_{it} + \epsilon_{it}, $$

dónde

  • $\alpha_{i}$denota efectos fijos individuales
  • $T_{i}$ es su tratamiento ficticio para las personas tratadas (es decir, varía entre personas pero no con el tiempo y, por lo tanto, no tiene $t$-subíndice)
  • $P_{t}$ es su indicador posterior al tratamiento (es decir, varía con el tiempo pero muestra el mismo patrón en todos los individuos y, por lo tanto, no tiene $i$-subíndice)
  • $X_{it}$ denota un vector de variables de control de nivel individual que varían en el tiempo

El maniquí de tratamiento $T_{i}$será absorbido por los efectos fijos individuales. Nuevamente, no se preocupe. Debido a que observa a los mismos individuos antes y después del tratamiento, puede estimar los efectos fijos individuales y sus estimaciones puntuales permanecerán sin cambios. Sin embargo, vale la pena señalar que estos efectos fijos podrían absorber parte de la varianza residual, lo que a su vez podría reducir el error estándar asociado con$\delta$. Revise esta publicación para obtener más información.

Si es un purista que odia ver mensajes de advertencia y / o NAvalores en su resultado de regresión, también puede estimar la siguiente ecuación:

$$ y_{it} = α_{i} + \gamma_{t} + \delta D_{it} + \theta X_{it} + \epsilon_{it}, $$

dónde $\alpha_{i}$ y $\gamma_{t}$representan efectos fijos individuales y diarios , respectivamente. La variable$D_{it}$es un maniquí de tratamiento. Que es el término de interacción de antes, solo representado de una manera diferente. Es igual a 1 si una persona está en tratamiento y en el período de postratamiento. Puede crear una instancia de esta variable manualmente si así lo desea (es decir,$D_{it} = T_{i} \times P_{t}$). Sus estimaciones puntuales deben ser similares en las dos especificaciones (se asume la equivalencia en ausencia de covariables). Esta ecuación también es útil en entornos donde el tiempo de tratamiento no está estandarizado en sus$i$ unidades y, por tanto, se puede utilizar en una variedad más amplia de circunstancias.

En resumen, los métodos DiD generalmente se aplican a datos de nivel agregado (por ejemplo, ciudades, condados, estados, etc.), pero también se pueden usar en un nivel inferior si observamos el mismo$i$unidades (por ejemplo, individuos) a lo largo del tiempo. Si se aplica a nivel individual, los efectos fijos individuales deberían absorber más variación y probablemente reducir el tamaño de sus errores estándar. Nuevamente, estas recomendaciones asumen que observa a las mismas personas a lo largo del tiempo.