Ereignisstudie mit zwei Behandlungen

Aug 21 2020

Nehmen wir an, ich wollte zwei verschiedene Behandlungen gleichzeitig in ein Diff in Diff aufnehmen, also hätte ich:

$y_{i,t} = \lambda_i +\tau_t + Treat1_i*post_t+Treat2_i*post_t + \eta_{i,t}$,

wo $\lambda_i$ sind gruppenfeste Effekte, post ist ein Dummy für die Nachbehandlung, $\tau_t$sind jahresfeste Effekte, und Treat1 gehört zu Behandlung 1 und Treat2 gehört zu Behandlung 2. Nehmen wir nun an, ich wollte eine Ereignisstudienspezifikation durchführen, um Pre-Trends zu untersuchen und dynamische Effekte aufzuspüren. Ist es sinnvoll, Folgendes auszuführen:

$y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat1_i *\mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat2_i *\mathbb{1}\{t=k\}\delta_k + \eta_{i,t}$

Wo ich das Ereignisjahr -1 weglasse, ein Jahr vor der Behandlung. Nehmen Sie auch an, dass beide Behandlungen zur gleichen Zeit stattfinden, also k = -1, Ereignisjahr ist für jede Behandlung das gleiche Jahr. Ergibt dies die normale Interpretation von Ereignisstudien für jede Schätzung von$\beta$ und $\delta$?

Ich denke intuitiv, dass es sinnvoll ist, aber meine Verwirrung ergibt sich aus der Tatsache, dass es in dieser Konfiguration jetzt 2 ausgelassene Kategorien gibt. Wie kann ich also sicherstellen, dass sich jeder Koeffizient auf den Dummies des Behandlungsereignisjahres auf die ausgelassene Gruppe bezieht? entsprechend dieser speziellen Behandlung?

Antworten

1 ThomasBilach Aug 21 2020 at 20:41

Wenn wir für alle behandelten Unternehmen eine standardisierte Behandlungsdauer annehmen, vereinfacht dies die Dinge. Ich habe Ihr erstes Modell unten reproduziert:

$$ y_{i,t} = \lambda_i + \tau_t + \beta (Treat^1_i \times Post_t) + \delta (Treat^2_i \times Post_t) + \eta_{i,t}, $$

wo ich die Ziffern hochgestellt habe, um die verschiedenen Behandlungen zu indizieren. Hier haben wir drei Expositionsgruppen (dh Kontrollgruppe, Behandlungsgruppe 1, Behandlungsgruppe 2) und zwei Kontraste. Sie vergleichen$Treat^1_i$mit der Kontrollgruppe und $Treat^2_i$ mit der Kontrollgruppe in einer großen Regression. $Post_t$ist genau definiert, damit wir auf diese Weise vorgehen können. Sobald verschiedene Entitäten (oder Gruppen von Entitäten) unterschiedliche Adoptionszeiträume haben, müssen wir dies auf unterschiedliche Weise angehen. Derzeit ist der "klassische" Differenz-in-Differenz-Ansatz (DD) mit einem für alle Gruppen spezifischen Nachbehandlungsindikator angemessen. Beachten Sie, dass Sie tatsächlich separate DD-Modelle für Teilmengen Ihrer Daten ausführen und dieselben Schätzungen erhalten können. Eine Teilmenge würde alle Steuerelemente und enthalten$Treat^1_i$Entitäten - nur; Ebenso würde der andere alle Kontrollen und einschließen$Treat^2_i$Entitäten - nur. Ich würde jedoch mit einer großen fetten Regression gehen. Dieser Beitrag befasste sich auch mit einer sehr ähnlichen Spezifikation.

Ich sollte ein Anliegen zur Kenntnis nehmen. Einschließlich$\lambda_i$ und $\tau_t$ist in Ordnung, aber Software (z. B. R) lässt aufgrund von Singularitäten drei Haupteffekte fallen. Zum Beispiel,$Treat^1_i$ und $Treat^2_i$ sind kollinear mit der Einheit feste Effekte (dh $\lambda_i$) und wird fallen gelassen. Ähnlich,$Post_t$ ist kollinear mit den zeitlich festgelegten Effekten (dh $\tau_t$) und wird ebenfalls fallen gelassen. Keine Sorge, das Entfernen der Haupteffekte sollte Ihre Schätzungen von nicht beeinflussen$\beta$ und $\delta$. Ignorieren Sie entweder die Singularitäten in Ihrer Ausgabe oder lassen Sie die festen Effekte fallen. In Einstellungen wie Ihrer, in denen Sie eine genau definierte Expositionsdauer haben, ist lediglich die Interaktion eines Behandlungsdummys mit einem Nachbehandlungsindikator erforderlich.

Wo ich das Ereignisjahr -1 weglasse, ein Jahr vor der Behandlung. Nehmen Sie auch an, dass beide Behandlungen zur gleichen Zeit stattfinden, also k = -1, Ereignisjahr ist für jede Behandlung das gleiche Jahr. Ergibt dies die normale Interpretation von Ereignisstudien für jede Schätzung von 𝛽 und 𝛿?

Ja. Wir haben immer noch die gleichen Kontraste. Reproduzieren Sie Ihre Gleichung:

$$ y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat^1_i * \mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat^2_i * \mathbb{1}\{t=k\}\delta_k + \eta_{i,t}, $$

wo Sie jetzt Ihre Gleichung mit Zeit (Jahr) Dummies sättigen. Ihre Referenz ist das Jahr vor der Behandlung (dh$k = -1$) oder welches Jahr auch immer Sie weglassen möchten. In dieser Einstellung zeigt Ihre Ausgabe einen vollständigen Satz eindeutiger Interaktionen von an$Treat^1_i$mit allen Jahren und einer ganzen Reihe von einzigartigen Interaktionen von$Treat^2_i$mit allen Jahren. Ein Jahr sollte (oder ich sollte sagen, wird) weggelassen werden; Das Jahr vor der Behandlung, das für beide Behandlungsgruppen gleich ist, ist eine gute Wahl. Beide Behandlungsattrappen werden jedoch von den Einheitseffekten absorbiert; Auch dies sollte Sie nicht betreffen.

Ich denke intuitiv, dass es sinnvoll ist, aber meine Verwirrung ergibt sich aus der Tatsache, dass es in dieser Konfiguration jetzt 2 ausgelassene Kategorien gibt. Wie kann ich also sicherstellen, dass sich jeder Koeffizient auf den Dummies des Behandlungsereignisjahres auf die ausgelassene Gruppe bezieht? entsprechend dieser speziellen Behandlung?

In den Kommentaren haben Sie angegeben, dass die Behandlung für alle Einheiten zur gleichen Zeit beginnt , unabhängig davon, ob sie sich in der Behandlung befinden$Treat^1_i$ oder $Treat^2_i$. Sie müssen nicht zwei Punkte weglassen. eine Periode wird ausreichen. An dieser Spezifikation ändert sich nichts wirklich, außer dass wir einen vollständigen Satz von Zeit- (Jahres-) Dummies aufgenommen haben.

Nehmen wir an, Sie beobachten 10 Distrikte über 10 Jahre, um dies ins rechte Licht zu rücken. Zwei Bezirke fallen in eine bezeichnete Behandlungsgruppe mit geringer Intensität$T_{L,i}$ und weitere 2 Bezirke fallen in eine bezeichnete Behandlungsgruppe mit hoher Intensität $T_{H,i}$. Die restlichen 6 erhalten keine Behandlung und dienen als Kontrollgruppe. Die Intervention beginnt in der Mitte Ihrer Zeitreihe. Alle behandelten Distrikte nehmen im selben Jahr eine Intervention vor, aber die beiden Behandlungsgruppen unterscheiden sich in dieser "kategorischen" Intensität. Einige Bezirke waren in ihrer Dosierung hoch und einige waren niedrig. Wenn Sie die letztere Gleichung ausführen, zeigt Ihre Ausgabe 9 Distrikteffekte, 9 Jahreseffekte, 9 Interaktionen zwischen einem Dummy mit geringer Intensität und Indikatoren für alle Jahre an ($T_{L,i} \times \mathbb{1}_{t = k}$) und weitere 9 Wechselwirkungen zwischen einem hochintensiven Dummy und Indikatoren für alle Jahre ($T_{H,i} \times \mathbb{1}_{t = k}$).

Die Wechselwirkungen repräsentieren die einzigartige Entwicklung der Wirkungen für jede kategoriale Behandlungsgruppe im Verhältnis zur Kontrollgruppe vor und nach der Intervention. Sie können sich die Auswirkungen in der Vorbehandlungsepoche vorstellen (dh$k < -1$) als Placebo-Behandlungen. Hoffentlich beobachten Sie die Konsequenzen der Intervention nicht, bevor sie beginnt! Starke Nicht-Null-Effekte in der Zeit vor der Behandlungsexposition könnten als Selektionsverzerrung interpretiert werden.

Auch dies funktioniert gut, wenn der Behandlungszeitpunkt für alle Gruppen genau definiert ist .