Tester les tendances parallèles dans les modèles de différence de différence avec un traitement échelonné
Suite à un commentaire d'un fil de discussion précédent (ci-dessous), je vous serais reconnaissant de bien vouloir me conseiller sur la façon de tester les tendances parallèles dans Stata pour un modèle DiD avec plusieurs groupes et un traitement échelonné (c.-à-d. Réforme des politiques). Presque toutes les unités finissent par être traitées. Méthode de la différence de différence: comment tester l'hypothèse d'une tendance commune entre le groupe de traitement et le groupe témoin?
La commande originale du modèle DiD est la suivante:
xtreg outcome i.policy i.year, fe vce(cluster id)
Une discussion très utile à ce sujet se trouve dans les liens ci-dessous, mais je n'ai pas pu l'implémenter dans Stata. http://econ.lse.ac.uk/staff/spischke/ec533/did.pdf http://econ.lse.ac.uk/staff/spischke/ec524/evaluation3.pdf
Merci d'avance.
@ThomasBilach. Merci beaucoup d'avoir partagé cet article. Je ne sais toujours pas quelles variables interagir. Dans votre article, T (ij) sont des interactions de l'indicateur de traitement et des variables temporelles. Deux questions, s'il vous plaît:
• Toutes les valeurs de T (ij) sont-elles les mêmes pour chaque pays (variable «traitement» dans mes données) ou est-ce que T (ij) est une variable qui bascule sur la date de mise en œuvre de la politique (variable «politique ”Dans mes données)?
• Par variables temporelles, Andy voulait-il dire la variable temporelle standardisée (variable «heure» dans mes données) ou la variable indicatrice de date (variable «date» dans mes données)?

Réponses
Dans l'article que vous avez référencé, l'objectif de la standardisation de la dimension temporelle est de faciliter le traçage des tendances avant et / ou après traitement. Dans certaines évaluations, une politique est introduite à des moments très différents dans différentes régions, de sorte que les chercheurs se concentrent souvent sur le moment où le traitement commence. Le but est d'obtenir une image précise de la façon dont votre résultat évolue avant une exposition d'intérêt. Dans certains contextes, un sous-ensemble d'unités d'adoption précoce peut subir un traitement à un moment donné, tandis que d'autres sont traités plus tard. Je recommanderais de tracer l'évolution des tendances du groupe avant le premier choc, puis peut-être un complot séparé pour les derniers adoptants. En résumé, l'évaluation des tendances parallèles dans les paramètres d'adoption échelonnée est souvent compliquée et vous oblige à faire quelques ajustements pour le démontrer visuellement.
Mais passons maintenant à l'estimation. Supposons que vous souhaitiez estimer ce qui suit:
$$ y_{it} = \mu_{i} + \lambda_{t} + \text{Policy}_{it} + \epsilon_{it}, $$
où $\mu_{i}$ et $\lambda_{t}$représentent des effets fixes pour les pays et les années, respectivement. Le mannequin de traitement,$\text{Policy}_{it}$, Devrait seulement « allumer » pour les pays traités et seulement au cours de leurs années de post-traitement, 0 sinon (voir un précédent post où je l' ai décrit le codage du mannequin de traitement plus en détail). Supposons que votre période postérieure pour un pays traité particulier ait eu lieu à partir de l'année 2015. Dans ce paramètre, votre mannequin passera de 0 à 1 pour cette juridiction particulière et pour tous$t$ans jusqu'à la fin de votre panel (ou jusqu'à l'arrêt du traitement). Ce modèle suppose que les effets du traitement sont immédiats et permanents. En d'autres termes, il n'évalue pas la dynamique de l'exposition. Encore,$\text{Policy}_{it}$est toujours votre terme d'interaction. Il équivaut à l'unité pour toute combinaison pays-année où votre police est en vigueur, 0 sinon. Pour les pays jamais traités, il doit être égal à 0 pour toutes les périodes d'observation.
Supposons maintenant que vous souhaitiez évaluer une dépendance temporelle dans $y$la réponse au choc. Dans le cas classique de différence de différences, où toutes les unités subissent un choc en même temps, cela est très facile. Vous interagissez entre un indicateur de traitement pour les pays traités et des variables nominales de temps post-traitement spécifiques aux pays traités et non traités. Le logiciel s'occupe de l'essentiel du travail à votre place. Dans votre contexte, cependant, votre exposition d'intérêt commence (et peut-être se termine) à des moments différents dans différents pays. Et, presque tous les pays subissent un traitement. Une variable délimitant la période «post» n'est pas utile dans les modèles d'adoption échelonnés, en partie parce qu'il n'y a pas de période bien définie délimitant le pré- et le post-traitement. Je vous recommande d'instancier la ou les variables de stratégie manuellement. Un codage approprié d'une variable factice de politique aura pour effet que tous les groupes et toutes les périodes soumis à la politique sont égaux à l'unité, 0 sinon. C'est votre terme d'interaction vient d'être défini d' une manière différente.
Au lieu d'un mannequin de politique discret, vous pouvez instancier une série d'indicateurs de politique avant et après exposition. Voici un exemple impliquant une avance et deux décalages du mannequin principal:
$$ y_{i,t} = \mu_{i} + \lambda_{t} + \delta_{+1}\text{Policy}_{i,t+1} + \delta \text{Policy}_{i,t} + \delta_{-1}\text{Policy}_{i,t-1} + \delta_{-2} \text{Policy}_{i,t-2} + \epsilon_{it}, $$
où $\text{Policy}_{i,t}$est l' effet immédiat de l'exposition pour tous les pays sous traitement. Pour être clair, l'effet immédiat ou instantané est égal à 1 pour un pays traité au cours de l' année d'adoption initiale (c'est-à-dire l'année du changement). Dans votre faux exemple, votre «année de changement» (ou devrais-je dire «jour de changement» pour rester cohérent avec votre exemple) est le 4 janvier pour le premier pays et le 3 janvier pour le deuxième pays. Vos "retards" examinent comment les effets évoluent depuis l'année d'adoption initiale (par exemple,$\text{Policy}_{i,t-1}$, $\text{Policy}_{i,t-2}$, $\text{Policy}_{i,t-3}$, etc.). Souvent, les interventions au niveau de la population ne sont pas perçues immédiatement après l'adoption de la politique; cela prend un certain temps avant que le plein effet ne soit réalisé. Si vous incluez des variables fictives pour toutes les périodes après l'année initiale de changement, vous cartographiez alors la réponse dynamique complète de votre résultat au changement de politique. Dans les paramètres dynamiques, chaque variable factice de stratégie est toujours un terme d'interaction. En d'autres termes, chaque variable factice de politique est la multiplication d'un indicateur de traitement par une série d'indicateurs d' année post-exposition . Là encore, l'interaction est implicite dans le codage de chaque variable de politique.
Stevenson et Wolfers 2006 utilisent une spécification similaire, rapportant tous les coefficients à partir de l'année d'adoption initiale sous forme de tableau (voir le tableau 1, p. 277). Plus tard, ils rapportent des estimations d'études d'événement qui représentent les estimations des coefficients pour toutes les périodes avant et après le changement de loi (voir Figure 1, p. 280). Chaque graphique est une régression distincte pour différents groupes d'âge, mais la structure est toujours la même. En reproduisant leur figure ci-dessous, ils représentent chaque estimation du mannequin de politique pour toutes les années par rapport au changement de loi (politique).

Je ne peux pas vous donner d'autres indications sur le nombre de variables de politique à inclure en dehors de l'effet immédiat. À des fins d'explication, je n'ai inclus qu'un seul responsable politique (c.-à-d.$\text{Policy}_{i,t+1}$), qui est égal à l'unité si un pays a déjà été traité et se trouve dans l'année précédant l' adoption du traitement. Vous devez vous attendre à votre estimation de$\delta_{+1}$être borné autour de zéro . Il est courant dans les articles de voir des graphiques des coefficients de chaque variable de politique. Saturer complètement votre modèle n'est pas nécessaire, mais est souvent utilisé pour exploiter le timing de l'intervention. Voir la réponse principale ici pour un cas d'utilisation populaire.