Est-ce une utilisation appropriée de la différence des différences?

Nov 08 2020

Voici la situation:

Il y a eu une intervention $T$.
Je suis intéressé par la façon dont cette intervention a changé les minutes passées à utiliser un ordinateur dans 5 comtés: $C_{a,t}, C_{b,t}, C_{c,t}, C_{d,t}, C_{e,t}$
J'ai quotidiennement des données pré / post sur les minutes / passées à utiliser un ordinateur sur 200 personnes de ces 5 comtés
De plus, j'ai trouvé des groupes `` témoins '' pour chacun des 5 comtés de traitement qui présentaient des tendances similaires pour un comté spécifique: $C_{a,c}, C_{b,c}, C_{c,c}, C_{d,c}, C_{e,c}$
J'ai également des données quotidiennes pré / post sur les minutes / passées à utiliser un ordinateur sur 200 personnes de ces 5 comtés

Ma question est la suivante: dois-je tenir compte du fait qu'il existe différents comtés autres que ceux qui utilisent des effets fixes? En d'autres termes, je m'attends à ce que l'effet du traitement soit le MÊME dans les 5 comtés.

Voici ce que je pensais. Ceci est estimé au niveau de l'individu (i) et du jour (t):

$Y_{it} = \alpha_{it} + \beta T_{it} + \gamma t_{it} + \delta (T_{it} · t_{it}) + C_{it} + \epsilon_{it}$

Où

$\alpha$ = terme constant
$\beta$ = effet spécifique du groupe de traitement
$\gamma$ = tendance temporelle commune aux groupes témoins et traités
$\delta$ = véritable effet du traitement
$C$ = effet fixe pour le comté

Est-ce une estimation précise de l'effet du traitement?

Réponses

1 ThomasBilach Nov 09 2020 at 02:34

La partie déroutante de votre équation, du moins pour moi, est votre inclusion d'un effet fixe de comté et d' un mannequin de traitement au niveau individuel . Laissez-moi élaborer. Voici votre équation de différence de différences (DiD) (Remarque: j'ai échangé la variable$t_{it}$ pour $P_{t}$car il est plus facile pour les yeux et désigne généralement un indicateur de post- traitement invariant par unité):

$$ y_{ict} = α + \beta T_{i} + \gamma P_{t} + \delta(T_{i} \times P_{t}) + C_{c} + \epsilon_{ict}, $$

où vous observez le résultat $y_{ict}$ pour individuel $i$ dans le comté $c$ à travers les jours $t$. Selon votre message,$\alpha$est une constante (c.-à-d. une interception globale) et ne doit pas être en indice; il ne varie pas dans le temps ni entre les individus.$T_{i}$est un mannequin de traitement pour les personnes traitées ; il devrait être égal à 1 pour les 200 personnes traitées dans les cinq comtés différents, 0 sinon.$P_{t}$est un indicateur post-traitement égal à 1 pour tous les jours après le début du traitement dans les groupes de traitement et de contrôle, 0 sinon. Sauf si j'ai mal compris votre équation, vous souhaitez également estimer les effets fixes du comté . Si oui, cela devrait être$c$-subscripted. Cela ne devrait rien changer à vos estimations ponctuelles. L'exécution de l'équation précédente dans le logiciel, telle quelle, renverra une estimation pour$\delta$. Cependant, votre effet de comté sera supprimé car il est colinéaire avec le mannequin de traitement. Votre estimation de$\delta$ restera inchangé.

Mais voyons si nous pouvons améliorer votre approche. Puisque vous observez les mêmes individus avant et après le traitement, vous pouvez estimer une équation DiD en utilisant des effets fixes individuels . Votre traitement apparaît bien défini au niveau de l'individu. Voici ce que je pense que vous devriez faire:

$$ y_{it} = α_{i} + \beta T_{i} + \gamma P_{t} + \delta(T_{i} \times P_{t}) + \theta X_{it} + \epsilon_{it}, $$

où

$\alpha_{i}$désigne des effets fixes individuels
$T_{i}$ est votre mannequin de traitement pour les personnes traitées (c.-à-d., il varie d'une personne à l'autre mais pas dans le temps et n'a donc pas $t$-indice)
$P_{t}$ est votre indicateur post-traitement (c'est-à-dire qu'il varie dans le temps mais présente le même schéma pour tous les individus et n'a donc pas $i$-indice)
$X_{it}$ désigne un vecteur de variables de contrôle au niveau individuel variant dans le temps

Le mannequin de traitement $T_{i}$seront absorbés par les effets fixes individuels. Encore une fois, ne vous inquiétez pas. Parce que vous observez les mêmes individus avant et après le traitement, vous pouvez estimer les effets fixes individuels et vos estimations ponctuelles resteront inchangées. Il convient toutefois de noter que ces effets fixes pourraient absorber une partie de la variance résiduelle, ce qui à son tour pourrait réduire l'erreur-type associée à$\delta$. Consultez cet article pour plus d'informations.

Si vous êtes un puriste qui déteste voir des messages d'avertissement et / ou des NAvaleurs dans votre sortie de régression, vous pouvez également estimer l'équation suivante:

$$ y_{it} = α_{i} + \gamma_{t} + \delta D_{it} + \theta X_{it} + \epsilon_{it}, $$

où $\alpha_{i}$ et $\gamma_{t}$représentent respectivement les effets fixes individuels et journaliers . La variable$D_{it}$est un mannequin de traitement. Il est votre terme d'interaction de plus tôt, juste représenté d'une manière différente. Il est égal à 1 si une personne est traitée et dans la période post-traitement. Vous pouvez instancier cette variable manuellement si vous le souhaitez (c.-à-d.$D_{it} = T_{i} \times P_{t}$). Vos estimations ponctuelles doivent être similaires pour les deux spécifications (l'équivalence est supposée en l'absence de covariables). Cette équation est également utile dans les contextes où le moment du traitement n'est pas standardisé$i$ et peut donc être utilisé dans une plus grande variété de circonstances.

En résumé, les méthodes DiD sont généralement appliquées aux données de niveau agrégé (par exemple, les villes, les comtés, les États, etc.), mais elles peuvent également être utilisées à un niveau inférieur si nous observons le même$i$les unités (par exemple, les individus) au fil du temps. S'ils sont appliqués au niveau de l'individu, les effets fixes individuels devraient absorber plus de variation et probablement réduire la taille de vos erreurs standard. Encore une fois, ces recommandations supposent que vous observez les mêmes individus au fil du temps.