Residuais de alta variância no grupo de eventos em CoxPH

Nov 26 2020

Estou usando R e coxph () para ajustar um modelo de risco proporcional de Cox. Quando eu ploto os resíduos de desvio usando

ggcoxdiagnostics(fit, type = "deviance", linear.predictions = FALSE)

eles parecem ter um leve viés negativo.

Se eu classificar meus dados de forma que os indivíduos que tiveram um evento sejam agrupados no final, noto que seus resíduos têm uma variância muito maior e parecem ter um leve viés positivo:

Posso ver o mesmo efeito para type="dfbeta. Os resíduos de Schoenfeld parecem bons e não são significativos, exceto por uma variável (p = 0,038). Isso é algo esperado?

Respostas

1 EdM Nov 27 2020 at 23:31

Esta página fornece um resumo sucinto dos diferentes tipos de resíduos para os modelos de Cox. Como diz:

Ao contrário dos resíduos de Gamarra, os resíduos de desvio são centrados na média em torno de 0, tornando-os significativamente mais fáceis de interpretar do que os resíduos de Gamarra ao procurar outliers.

Assim, "eles parecem ter um leve viés negativo" em seus dados pode ser uma ilusão de ótica. (Verifique se o ggcoxdiagnosticsgráfico não truncou o eixo y de alguma forma.)

Resíduos de desvio são mais bem usados ​​para descobrir outliers. Sim, você tem uma ampla gama de residuais, mas (pelo menos nessas parcelas) nenhum que pareça escandalosamente pior do que os outros.

A página vinculada também aponta:

Um resíduo de desvio valorado positivamente é indicativo de uma observação em que o evento ocorreu antes do previsto; o inverso é verdadeiro para o resíduo com valor negativo.

Os casos censurados só podem ter eventos que ocorram depois do previsto. Em seu segundo gráfico, os resíduos de desvio para os casos censurados são, portanto, todos negativos. Os casos com eventos, ao contrário, têm tempos de evento conhecidos, de modo que seus resíduos podem ser positivos ou negativos. Junto com o requisito de que o resíduo do desvio médio seja 0, você obtém a forma geral desse gráfico.