Test auf parallele Trends in Differenz-in-Differenz-Modellen mit gestaffelter Behandlung

Nov 26 2020

Nach einem Kommentar aus einem früheren Thread (unten) würde ich mich freuen, wenn Sie mir raten könnten, wie ich in Stata für ein DiD-Modell mit mehreren Gruppen und gestaffelter Behandlung (dh politische Reform) auf parallele Trends testen kann. Fast alle Einheiten werden irgendwann behandelt. Differenz in der Differenzmethode: Wie kann die Annahme eines gemeinsamen Trends zwischen Behandlung und Kontrollgruppe überprüft werden?

Der ursprüngliche DiD-Modellbefehl lautet wie folgt:

xtreg outcome i.policy i.year, fe vce(cluster id)

Eine sehr nützliche Diskussion dazu finden Sie in den folgenden Links, ich konnte sie jedoch nicht in Stata implementieren. http://econ.lse.ac.uk/staff/spischke/ec533/did.pdf http://econ.lse.ac.uk/staff/spischke/ec524/evaluation3.pdf

Danke im Voraus.


@ ThomasBilach. Vielen Dank für das Teilen dieses Beitrags. Ich bin immer noch verwirrt darüber, welche Variablen ich interagieren soll. In Ihrem Beitrag sind T (ij) Wechselwirkungen zwischen dem Behandlungsindikator und Zeitattrappen. Bitte zwei Fragen:
• Sind alle Werte von T (ij) für jedes Land gleich (Variable „Behandlung“ in meinen Daten) oder ist T (ij) eine Variable, die das Datum umschaltet, an dem die Richtlinie implementiert wurde (Variable „Richtlinie“) ”In meinen Daten)?
• Meinte Andy mit Zeitattrappen die standardisierte Zeitvariable (Variable „Zeit“ in meinen Daten) oder die Datumsattrappe (Variable „Datum“ in meinen Daten)?

Beachten Sie, dass fast alle Länder letztendlich behandelt werden.

Antworten

ThomasBilach Nov 29 2020 at 05:07

In dem Beitrag, auf den Sie verwiesen haben, besteht der Zweck der Standardisierung der Zeitdimension darin, das Zeichnen der Trends vor und / oder nach der Behandlung zu erleichtern. In einigen Bewertungen wird eine Richtlinie zu sehr unterschiedlichen Zeiten in verschiedenen Regionen eingeführt, sodass sich die Forscher häufig auf den Beginn der Behandlung konzentrieren. Der Zweck besteht darin, ein genaues Bild davon zu erhalten, wie sich Ihr Ergebnis entwickelt, bevor Sie sich für etwas interessieren. Bei einigen Einstellungen kann eine Untergruppe von Early-Adopter-Einheiten zu einem bestimmten Zeitpunkt behandelt werden, während andere später behandelt werden. Ich würde empfehlen, die Entwicklung der Gruppentrends vor dem ersten Schock und dann möglicherweise eine separate Darstellung für die späten Anwender zu zeichnen. In der Summe ist die Bewertung paralleler Trends in gestaffelten Adoptionen häufig unübersichtlich und erfordert einige Anpassungen, um dies visuell zu demonstrieren.

Aber jetzt wenden wir uns der Schätzung zu. Angenommen, Sie möchten Folgendes schätzen:

$$ y_{it} = \mu_{i} + \lambda_{t} + \text{Policy}_{it} + \epsilon_{it}, $$

wo $\mu_{i}$ und $\lambda_{t}$stellen feste Effekte für Länder bzw. Jahre dar. Die Behandlungsattrappe,$\text{Policy}_{it}$, sollte nur für behandelte Länder und nur während ihrer Nachbehandlungsjahre "eingeschaltet" werden, andernfalls 0 (siehe einen vorherigen Beitrag, in dem ich die Codierung der Behandlungsattrappe ausführlicher beschrieben habe). Angenommen, Ihre Nachperiode für ein bestimmtes behandeltes Land war ab dem Jahr 2015. In dieser Einstellung wechselt Ihr Dummy für diese bestimmte Gerichtsbarkeit und für alle von 0 auf 1$t$Jahre bis zum Ende Ihres Panels (oder bis die Behandlung abgebrochen wird). Dieses Modell geht davon aus, dass die Wirkung der Behandlung unmittelbar und dauerhaft ist. Mit anderen Worten, beurteilt er die Dynamik der Exposition. Nochmal,$\text{Policy}_{it}$ist immer noch Ihr Interaktionsbegriff. Dies entspricht der Einheit für jede Länder-Jahr-Kombination, in der Ihre Richtlinie in Kraft ist, andernfalls 0. Für Länder, die nie behandelt wurden, sollte sie für alle beobachteten Zeiträume gleich 0 sein.

Angenommen, Sie möchten eine Zeitabhängigkeit in bewerten $y$Antwort auf den Schock. Im klassischen Differenz-in-Differenz-Fall, bei dem alle Einheiten gleichzeitig einen Schock erfahren, ist dies sehr einfach. Sie interagieren einen Behandlungsindikator für behandelte Länder mit Dummies für die Nachbehandlungszeit, die für behandelte und unbehandelte Länder spezifisch sind. Software erledigt den größten Teil des schweren Hebens für Sie. In Ihrer Umgebung beginnt (und endet) Ihr Interesse jedoch möglicherweise zu unterschiedlichen Zeiten in verschiedenen Ländern. Und fast alle Länder werden schließlich behandelt. Eine Variable, die den Zeitraum "nach" abgrenzt, ist bei gestaffelten Adoptionsentwürfen nicht nützlich, teilweise weil es keinen genau definierten Zeitraum gibt, der die Vor- und Nachbehandlung abgrenzt. Ich empfehle Ihnen, die Richtlinienvariablen manuell zu instanziieren. Bei einer ordnungsgemäßen Codierung eines Richtlinien-Dummys sind alle Gruppen und Zeiträume, die der Richtlinie unterliegen, gleich Eins, andernfalls 0. Dies ist Ihr Interaktionsbegriff, der gerade anders definiert wurde.

Anstelle eines einzelnen Richtlinien-Dummys können Sie eine Reihe von Richtlinien-Dummies vor und nach der Exposition instanziieren. Hier ist ein Beispiel mit einem Lead und zwei Lags des Hauptrichtlinien-Dummys:

$$ y_{i,t} = \mu_{i} + \lambda_{t} + \delta_{+1}\text{Policy}_{i,t+1} + \delta \text{Policy}_{i,t} + \delta_{-1}\text{Policy}_{i,t-1} + \delta_{-2} \text{Policy}_{i,t-2} + \epsilon_{it}, $$

wo $\text{Policy}_{i,t}$ist die unmittelbare Auswirkung der Exposition für alle Länder, die sich in Behandlung befinden. Um klar zu sein, ist die unmittelbare oder sofortige Wirkung für ein behandeltes Land im ersten Adoptionsjahr (dh im Jahr der Änderung) gleich 1. In Ihrem gefälschten Beispiel ist Ihr "Jahr der Veränderung" (oder sollte ich "Tag der Veränderung" sagen, um die Übereinstimmung mit Ihrem Beispiel zu gewährleisten) der 4. Januar für das erste Land und der 3. Januar für das zweite Land. Ihre "Verzögerungen" untersuchen, wie sich die Auswirkungen seit dem ersten Adoptionsjahr entwickeln (z.$\text{Policy}_{i,t-1}$, $\text{Policy}_{i,t-2}$, $\text{Policy}_{i,t-3}$, usw.). Oft werden Interventionen auf Bevölkerungsebene nicht unmittelbar nach der Annahme der Politik wahrgenommen. Es dauert einige Zeit, bis die volle Wirkung erreicht ist. Wenn Sie Richtlinien-Dummies für alle Zeiträume nach dem ersten Jahr der Änderung einschließen, ordnen Sie die vollständige dynamische Reaktion Ihres Ergebnisses auf die Richtlinienänderung zu. In dynamischen Einstellungen ist jeder Richtlinien-Dummy immer noch ein Interaktionsbegriff. Mit anderen Worten, jeder Policy-Dummy ist die Multiplikation eines Behandlungsindikators mit einer Reihe von Dummies für das Jahr nach Exposition . Auch hier ist die Wechselwirkung impliziter in der Codierung jedes Richtlinienvariablen.

Stevenson und Wolfers 2006 verwenden eine ähnliche Spezifikation und geben alle Koeffizienten ab dem ersten Adoptionsjahr in tabellarischer Form an (siehe Tabelle 1, S. 277). Später berichten sie über Schätzungen von Ereignisstudien, die Schätzungen des Koeffizienten für alle Zeiträume vor und nach der Gesetzesänderung darstellen (siehe Abbildung 1, S. 280). Jedes Diagramm ist eine separate Regression für verschiedene Altersgruppen, aber die Struktur ist immer noch dieselbe. Sie geben ihre Abbildung unten wieder und zeichnen jede Schätzung des Richtlinien-Dummys für alle Jahre in Bezug auf die Gesetzesänderung auf.

Ich kann keine weiteren Hinweise dazu geben, wie viele Richtlinienvariablen außerhalb der unmittelbaren Wirkung einbezogen werden sollen. Zu Erklärungszwecken habe ich nur einen Richtlinienhinweis angegeben (z.$\text{Policy}_{i,t+1}$), was der Einheit entspricht, wenn ein Land jemals behandelt wurde und sich im Jahr vor der Annahme der Behandlung befindet. Sie sollten Ihre Schätzung von erwarten$\delta_{+1}$begrenzt werden , um den Nullpunkt . In Papieren ist es üblich, Diagramme der Koeffizienten für jede Richtlinienvariable zu sehen. Eine vollständige Sättigung Ihres Modells ist nicht erforderlich, wird jedoch häufig verwendet, um den Zeitpunkt des Eingriffs auszunutzen . In der Top- Antwort finden Sie einen beliebten Anwendungsfall.