Estudo de evento com dois tratamentos

Aug 21 2020

Digamos que eu quisesse incluir dois tratamentos diferentes em uma diferença em uma diferença ao mesmo tempo, para que eu pudesse:

$y_{i,t} = \lambda_i +\tau_t + Treat1_i*post_t+Treat2_i*post_t + \eta_{i,t}$,

Onde $\lambda_i$ são efeitos fixos de grupo, post é um manequim para pós-tratamento, $\tau_t$são efeitos fixos de ano, e Treat1 pertence ao tratamento 1 e Treat2 pertence ao tratamento 2. Agora, digamos que eu quisesse executar uma especificação de estudo de evento para inspecionar tendências prévias e rastrear efeitos dinâmicos. faz sentido executar o seguinte:

$y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat1_i *\mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat2_i *\mathbb{1}\{t=k\}\delta_k + \eta_{i,t}$

Onde omito o evento ano -1, um ano antes do tratamento. Suponha também que ambos os tratamentos ocorram ao mesmo tempo, então k = -1, ano do evento é o mesmo ano para cada tratamento. Isso produz a interpretação normal dos estudos de eventos para cada estimativa de$\beta$ e $\delta$?

Eu acho que intuitivamente faz sentido, mas minha confusão é decorrente do fato de que nesta configuração, agora existem 2 categorias omitidas, então como posso garantir que cada coeficiente nas dummies de ano de evento de tratamento seja com referência ao grupo omitido correspondente a esse tratamento específico?

Respostas

1 ThomasBilach Aug 21 2020 at 20:41

Se assumirmos um período de adoção de tratamento padronizado para todas as entidades tratadas, isso simplifica as coisas. Eu reproduzi seu primeiro modelo abaixo:

$$ y_{i,t} = \lambda_i + \tau_t + \beta (Treat^1_i \times Post_t) + \delta (Treat^2_i \times Post_t) + \eta_{i,t}, $$

onde substituí os numerais para indexar os diferentes tratamentos. Aqui, temos três grupos de exposição (ou seja, grupo de controle, grupo de tratamento 1, grupo de tratamento 2) e dois contrastes. Você está comparando$Treat^1_i$com o grupo de controle e $Treat^2_i$ com o grupo de controle em uma grande regressão. $Post_t$está bem definido para que possamos proceder desta forma. Uma vez que diferentes entidades (ou grupos de entidades) têm diferentes períodos de adoção, precisamos abordar isso de uma maneira diferente. Por enquanto, a abordagem "clássica" de diferença em diferenças (DD) com um indicador de pós-tratamento específico para todos os grupos é apropriada. Observe, você pode realmente executar modelos DD separados em subconjuntos de seus dados e obter as mesmas estimativas. Um subconjunto incluiria todos os controles e$Treat^1_i$entidades - apenas; da mesma forma, o outro incluiria todos os controles e$Treat^2_i$entidades - apenas. No entanto, eu iria com uma grande regressão gorda. Este post também abordou uma especificação muito semelhante.

Devo notar uma preocupação. Incluindo$\lambda_i$ e $\tau_t$está bem, mas o software (por exemplo, R) perderá três efeitos principais devido às singularidades. Por exemplo,$Treat^1_i$ e $Treat^2_i$ são colineares com os efeitos fixos da unidade (ou seja, $\lambda_i$) e será descartado. Similarmente,$Post_t$ é colinear com os efeitos fixos no tempo (ou seja, $\tau_t$) e também será descartado. Não se preocupe, a remoção dos efeitos principais não deve afetar suas estimativas de$\beta$ e $\delta$. Ignore as singularidades em sua saída ou elimine os efeitos fixos. Em ambientes como o seu, onde você tem um período de exposição bem definido, a interação de um manequim de tratamento com um indicador de pós-tratamento é tudo o que é necessário.

Onde omito o evento ano -1, um ano antes do tratamento. Suponha também que ambos os tratamentos ocorram ao mesmo tempo, então k = -1, ano do evento é o mesmo ano para cada tratamento. Isso produz a interpretação normal dos estudos de eventos para cada estimativa de 𝛽 e 𝛿?

Sim. Ainda temos os mesmos contrastes. Reproduzindo sua equação:

$$ y_{i,t} = \lambda_i +\tau_t + \sum\limits_{k \neq -1}Treat^1_i * \mathbb{1}\{t=k\}\beta_k + \sum\limits_{k \neq -1}Treat^2_i * \mathbb{1}\{t=k\}\delta_k + \eta_{i,t}, $$

onde agora você satura sua equação com dummies de tempo (ano). Sua referência é o ano antes do tratamento (ou seja,$k = -1$) ou o ano que você decidir omitir. Nesta configuração, sua saída exibirá um conjunto completo de interações exclusivas de$Treat^1_i$com todos os anos e um conjunto completo de interações exclusivas de$Treat^2_i$com todos os anos. Um ano deve (ou devo dizer que será) omitido; o ano antes do tratamento, que é o mesmo para os dois grupos de tratamento, é uma boa escolha. Ambos os manequins de tratamento, entretanto, serão absorvidos pelos efeitos fixos da unidade; novamente, isso não deve preocupar você.

Acho que intuitivamente faz sentido, mas minha confusão é decorrente do fato de que, nesta configuração, agora há 2 categorias omitidas, então como posso garantir que cada coeficiente nas dummies de ano de evento de tratamento seja com referência ao grupo omitido correspondente a esse tratamento específico?

Nos comentários você indicou que o tratamento começa na mesma hora para todas as unidades , independentemente de estarem em$Treat^1_i$ ou $Treat^2_i$. Você não precisa omitir dois pontos; um período será suficiente. Nada está realmente mudando nesta especificação, exceto incluímos um conjunto completo de dummies de tempo (ano).

Para colocar isso em perspectiva, suponha que você observe 10 distritos ao longo de 10 anos. Dois distritos se enquadram em um grupo de tratamento de baixa intensidade denotado$T_{L,i}$ e outros 2 distritos caem em um grupo de tratamento de alta intensidade denotado $T_{H,i}$. Os 6 restantes não recebem nenhum tratamento e servem como seu grupo de controle. A intervenção começa no meio de sua série temporal. Todos os distritos tratados adotam alguma intervenção no mesmo ano, mas os dois grupos de tratamento variam neste nível "categórico" de intensidade; alguns distritos tinham dosagem alta e alguns eram baixos. Executando a última equação, sua produção exibirá 9 efeitos distritais, 9 efeitos de ano, 9 interações entre um manequim de baixa intensidade e indicadores para todos os anos ($T_{L,i} \times \mathbb{1}_{t = k}$) e outras 9 interações entre uma dummy de alta intensidade e indicadores para todos os anos ($T_{H,i} \times \mathbb{1}_{t = k}$)

As interações representam a evolução única dos efeitos para cada grupo de tratamento categórico, em relação ao grupo de controle, antes e depois da intervenção. Você pode pensar nos efeitos na época de pré-tratamento (ou seja,$k < -1$) como tratamentos com placebo. Espero que você não observe as consequências da intervenção antes de ela começar! Quaisquer efeitos fortes diferentes de zero na era anterior à exposição ao tratamento podem ser interpretados como viés de seleção.

Novamente, isso funciona bem quando o tempo de tratamento está bem definido para todos os grupos.