Estudio de eventos con dos tratamientos
Digamos que quería incluir dos tratamientos diferentes en un diff in diff al mismo tiempo, por lo que podría tener:
$y_{i,t} = \lambda_i +\tau_t + Treat1_i*post_t+Treat2_i*post_t + \eta_{i,t}$,
dónde $\lambda_i$ son efectos fijos de grupo, post es una simulación para post-tratamiento, $\tau_t$son efectos fijos por año, y Treat1 pertenece al tratamiento 1 y Treat2 pertenece al tratamiento 2. Ahora digamos que quería ejecutar una especificación de estudio de eventos para inspeccionar las tendencias previas y rastrear efectos dinámicos. ¿Tiene sentido ejecutar lo siguiente?
$y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat1_i *\mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat2_i *\mathbb{1}\{t=k\}\delta_k + \eta_{i,t}$
Donde omito el evento año -1, un año antes del tratamiento. Suponga también que ambos tratamientos ocurren al mismo tiempo, por lo que k = -1, el año del evento es el mismo año para cada tratamiento. ¿Esto produce la interpretación normal de los estudios de eventos para cada estimación de$\beta$ y $\delta$?
Creo intuitivamente que tiene sentido, pero mi confusión surge del hecho de que en esta configuración, ahora hay 2 categorías omitidas, entonces, ¿cómo me aseguro de que cada coeficiente en las variables ficticias del año del evento de tratamiento sea con referencia al grupo omitido? correspondiente a ese tratamiento en particular?
Respuestas
Si asumimos un período de adopción de tratamiento estandarizado para todas las entidades tratadas, entonces simplifica las cosas. Reproduje su primer modelo a continuación:
$$ y_{i,t} = \lambda_i + \tau_t + \beta (Treat^1_i \times Post_t) + \delta (Treat^2_i \times Post_t) + \eta_{i,t}, $$
donde escribí los números en superíndice para indexar los diferentes tratamientos. Aquí, tenemos tres grupos de exposición (es decir, grupo de control, grupo de tratamiento 1, grupo de tratamiento 2) y dos contrastes. Estas comparando$Treat^1_i$con el grupo de control y $Treat^2_i$ con el grupo de control en una gran regresión. $Post_t$está bien definido para que podamos proceder de esta manera. Una vez que diferentes entidades (o grupos de entidades) tienen diferentes períodos de adopción, entonces debemos abordar esto de una manera diferente. Por ahora, el enfoque "clásico" de diferencias en diferencias (DD) con un indicador de postratamiento específico para todos los grupos es apropiado. Tenga en cuenta que, en realidad, podría ejecutar modelos DD separados en subconjuntos de sus datos y obtener las mismas estimaciones. Un subconjunto incluiría todos los controles y$Treat^1_i$entidades — solamente; Asimismo, el otro incluiría todos los controles y$Treat^2_i$entidades — solamente. Sin embargo, iría con una gran regresión. Esta publicación también abordó una especificación muy similar.
Debo notar una preocupación. Incluso$\lambda_i$ y $\tau_t$está bien, pero el software (por ejemplo, R) eliminará tres efectos principales debido a las singularidades. Por ejemplo,$Treat^1_i$ y $Treat^2_i$ son colineales con los efectos fijos unitarios (es decir, $\lambda_i$) y se eliminará. Similar,$Post_t$ es colineal con los efectos fijos de tiempo (es decir, $\tau_t$) y también se eliminarán. No se preocupe, la eliminación de los efectos principales no debería afectar sus estimaciones de$\beta$ y $\delta$. O ignore las singularidades en su salida o elimine los efectos fijos. En entornos como el suyo, donde tiene un período de exposición bien definido, todo lo que se necesita es la interacción de un maniquí de tratamiento con un indicador de postratamiento.
Donde omito el evento año -1, un año antes del tratamiento. Suponga también que ambos tratamientos ocurren al mismo tiempo, por lo que k = -1, el año del evento es el mismo año para cada tratamiento. ¿Esto produce la interpretación normal de los estudios de eventos para cada estimación de 𝛽 y 𝛿?
Si. Seguimos teniendo los mismos contrastes. Reproduciendo tu ecuación:
$$ y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat^1_i * \mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat^2_i * \mathbb{1}\{t=k\}\delta_k + \eta_{i,t}, $$
donde ahora satura su ecuación con variables ficticias de tiempo (año). Su referencia es el año anterior al tratamiento (es decir,$k = -1$) o el año que decida omitir. En esta configuración, su salida mostrará un conjunto completo de interacciones únicas de$Treat^1_i$con todos los años y un conjunto completo de interacciones únicas de$Treat^2_i$con todos los años. Debería omitirse un año (o debería decir que lo hará); el año anterior al tratamiento, que es el mismo para los dos grupos de tratamiento, es una buena opción. Sin embargo, ambas variables ficticias de tratamiento serán absorbidas por los efectos fijos unitarios; de nuevo, esto no debería preocuparte.
Creo que intuitivamente tiene sentido, pero mi confusión surge del hecho de que en esta configuración, ahora hay 2 categorías omitidas, entonces, ¿cómo me aseguro de que cada coeficiente en las variables ficticias del año del evento de tratamiento se refiera al grupo omitido? correspondiente a ese tratamiento en particular?
En los comentarios indicó que el tratamiento comienza a la misma hora para todas las unidades , independientemente de que estén en$Treat^1_i$ o $Treat^2_i$. No es necesario que omita dos puntos; un período será suficiente. Nada está cambiando realmente en esta especificación aparte de que incluimos un conjunto completo de variables ficticias de tiempo (año).
Para poner esto en perspectiva, suponga que observa 10 distritos durante 10 años. Dos distritos caen en un grupo de tratamiento de baja intensidad denotado$T_{L,i}$ y otros 2 distritos caen en un grupo de tratamiento de alta intensidad denotado $T_{H,i}$. Los 6 restantes no reciben ningún tratamiento y sirven como grupo de control. La intervención comienza a la mitad de su serie temporal. Todos los distritos tratados adoptan alguna intervención en el mismo año, pero los dos grupos de tratamiento varían en este nivel "categórico" de intensidad; algunos distritos tenían altas dosis y otros bajas. Al ejecutar la última ecuación, su resultado mostrará 9 efectos de distrito, efectos de 9 años, 9 interacciones entre una variable ficticia de baja intensidad e indicadores para todos los años ($T_{L,i} \times \mathbb{1}_{t = k}$) y otras 9 interacciones entre una variable ficticia de alta intensidad e indicadores para todos los años ($T_{H,i} \times \mathbb{1}_{t = k}$).
Las interacciones representan la evolución única de los efectos para cada grupo de tratamiento categórico, en relación con el grupo de control, antes y después de la intervención. Puede pensar en los efectos en la época del pretratamiento (es decir,$k < -1$) como tratamientos con placebo. ¡Ojalá no observe las consecuencias de la intervención antes de que comience! Cualquier efecto fuerte distinto de cero en la era anterior a la exposición al tratamiento podría interpretarse como sesgo de selección.
Nuevamente, esto funciona bien cuando el momento del tratamiento está bien definido para todos los grupos.