Event Study con due trattamenti
Diciamo che volevo includere due diversi trattamenti in un diff in diff allo stesso tempo, quindi avrei potuto:
$y_{i,t} = \lambda_i +\tau_t + Treat1_i*post_t+Treat2_i*post_t + \eta_{i,t}$,
dove $\lambda_i$ sono effetti fissi di gruppo, il post è un manichino per il post trattamento, $\tau_t$sono effetti fissi per l'anno e Treat1 appartiene al trattamento 1 e Treat2 appartiene al trattamento 2. Ora diciamo che volevo eseguire una specifica di studio dell'evento per esaminare le tendenze preliminari e tracciare gli effetti dinamici. ha senso eseguire quanto segue:
$y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat1_i *\mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat2_i *\mathbb{1}\{t=k\}\delta_k + \eta_{i,t}$
Dove ometto l'evento anno -1, un anno prima del trattamento. Supponiamo inoltre che entrambi i trattamenti avvengano contemporaneamente, quindi k = -1, l'anno dell'evento è lo stesso anno per ogni trattamento. Questo produce la normale interpretazione degli studi sugli eventi per ciascuna stima di$\beta$ e $\delta$?
Penso che intuitivamente abbia senso, ma la mia confusione deriva dal fatto che in questa configurazione ora ci sono 2 categorie omesse, quindi come posso assicurarmi che ogni coefficiente sui manichini dell'anno dell'evento di trattamento sia con riferimento al gruppo omesso corrispondente a quel particolare trattamento?
Risposte
Se assumiamo un periodo di adozione del trattamento standardizzato per tutte le entità trattate, semplifica le cose. Ho riprodotto il tuo primo modello di seguito:
$$ y_{i,t} = \lambda_i + \tau_t + \beta (Treat^1_i \times Post_t) + \delta (Treat^2_i \times Post_t) + \eta_{i,t}, $$
dove ho sovrascritto i numeri per indicizzare i diversi trattamenti. Qui abbiamo tre gruppi di esposizione (cioè gruppo di controllo, gruppo di trattamento 1, gruppo di trattamento 2) e due contrasti. Stai confrontando$Treat^1_i$con il gruppo di controllo e $Treat^2_i$ con il gruppo di controllo in una grande regressione. $Post_t$è ben definito quindi possiamo procedere in questo modo. Una volta che entità diverse (o gruppi di entità) hanno periodi di adozione diversi, è necessario affrontarli in modo diverso. Per ora, l'approccio "classico" della differenza nelle differenze (DD) con un indicatore post-trattamento specifico per tutti i gruppi è appropriato. Nota, potresti effettivamente eseguire modelli DD separati su sottoinsiemi di dati e ottenere le stesse stime. Un sottoinsieme includerebbe tutti i controlli e$Treat^1_i$entità: solo; allo stesso modo, l'altro includerebbe tutti i controlli e$Treat^2_i$entità — solo. Tuttavia, vorrei andare con una grande regressione grassa. Questo post ha anche affrontato una specifica molto simile.
Dovrei notare una preoccupazione. Compreso$\lambda_i$ e $\tau_t$va bene, ma il software (ad esempio, R) lascerà cadere tre effetti principali a causa delle singolarità. Per esempio,$Treat^1_i$ e $Treat^2_i$ sono allineati con gli effetti fissi dell'unità (ad es. $\lambda_i$) e verrà eliminato. Allo stesso modo,$Post_t$ è allineato con gli effetti fissi nel tempo (ad es. $\tau_t$) e verrà anche eliminato. Non preoccuparti, la rimozione degli effetti principali non dovrebbe influire sulle tue stime di$\beta$ e $\delta$. Ignora le singolarità nel tuo output o elimina gli effetti fissi. In ambienti come il tuo in cui hai un periodo di esposizione ben definito, l'interazione di un manichino di trattamento con un indicatore di post-trattamento è tutto ciò che è necessario.
Dove ometto l'evento anno -1, un anno prima del trattamento. Supponiamo inoltre che entrambi i trattamenti avvengano contemporaneamente, quindi k = -1, l'anno dell'evento è lo stesso anno per ogni trattamento. Questo produce la normale interpretazione degli studi sugli eventi per ciascuna stima di 𝛽 e 𝛿?
Sì. Abbiamo ancora gli stessi contrasti. Riprodurre la tua equazione:
$$ y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat^1_i * \mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat^2_i * \mathbb{1}\{t=k\}\delta_k + \eta_{i,t}, $$
dove ora saturi la tua equazione con i manichini del tempo (anno). Il tuo riferimento è l'anno prima del trattamento (ad es.$k = -1$) o qualsiasi anno decidi di omettere. In questa impostazione, l'output mostrerà un set completo di interazioni uniche di$Treat^1_i$con tutti gli anni e una serie completa di interazioni uniche di$Treat^2_i$con tutti gli anni. Un anno dovrebbe (o dovrei dire sarà) essere omesso; l'anno prima del trattamento, che è lo stesso per i due gruppi di trattamento, è una buona scelta. Entrambi i manichini di trattamento, tuttavia, saranno assorbiti dagli effetti fissi dell'unità; ancora una volta, questo non dovrebbe riguardarti.
Penso che intuitivamente abbia senso, ma la mia confusione deriva dal fatto che in questa configurazione ora ci sono 2 categorie omesse, quindi come posso assicurarmi che ogni coefficiente sui manichini dell'anno dell'evento di trattamento sia con riferimento al gruppo omesso corrispondente a quel particolare trattamento?
Nei commenti hai indicato che il trattamento inizia allo stesso tempo per tutte le unità , indipendentemente dal fatto che siano in$Treat^1_i$ o $Treat^2_i$. Non è necessario omettere due punti; un periodo sarà sufficiente. Niente sta realmente cambiando in questa specifica a parte l'inclusione di una serie completa di manichini temporali (anno).
Per mettere questo in prospettiva, supponiamo di osservare 10 distretti in 10 anni. Due distretti rientrano in un gruppo di trattamento a bassa intensità indicato$T_{L,i}$ e altri 2 distretti rientrano in un gruppo di trattamento ad alta intensità indicato $T_{H,i}$. I restanti 6 non ricevono alcun trattamento e fungono da gruppo di controllo. L'intervento inizia a metà della tua serie temporale. Tutti i distretti trattati adottano alcuni interventi nello stesso anno, ma i due gruppi di trattamento variano in questo livello di intensità "categoriale"; alcuni distretti erano alti nel loro dosaggio e alcuni erano bassi. Eseguendo quest'ultima equazione, il tuo output mostrerà 9 effetti distrettuali, 9 anni effetti, 9 interazioni tra un manichino a bassa intensità e indicatori per tutti gli anni ($T_{L,i} \times \mathbb{1}_{t = k}$) e altre 9 interazioni tra un manichino ad alta intensità e indicatori per tutti gli anni ($T_{H,i} \times \mathbb{1}_{t = k}$).
Le interazioni rappresentano l'evoluzione unica degli effetti per ciascun gruppo di trattamento categoriale, rispetto al gruppo di controllo, prima e dopo l'intervento. Puoi pensare agli effetti nell'epoca del pretrattamento (ad es.$k < -1$) come trattamenti placebo. Si spera che tu non osservi le conseguenze dell'intervento prima che inizi! Qualsiasi forte effetto diverso da zero nell'era precedente l'esposizione al trattamento potrebbe essere interpretato come bias di selezione.
Ancora una volta, questo funziona bene quando la tempistica del trattamento è ben definita per tutti i gruppi.