Résidus à variance élevée dans le groupe d'événements dans CoxPH

Nov 26 2020

J'utilise R et coxph () pour ajuster un modèle de risque proportionnel de Cox. Quand je trace les résidus de déviance en utilisant

ggcoxdiagnostics(fit, type = "deviance", linear.predictions = FALSE)

ils semblent avoir un léger biais négatif.

Si je trie mes données de sorte que les individus qui ont eu un événement soient regroupés à la fin, je remarque que leurs résidus ont une variance beaucoup plus élevée et semblent avoir un léger biais positif:

Je peux voir le même effet pour type="dfbeta. Les résidus de Schoenfeld semblent bons et ne sont pas significatifs, sauf pour une variable (p = 0,038). Est-ce quelque chose à prévoir?

Réponses

1 EdM Nov 27 2020 at 23:31

Cette page fournit un résumé succinct des différents types de résidus pour les modèles de Cox. Comme il dit:

Contrairement aux résidus de Martingale, les résidus de déviance sont centrés en moyenne autour de 0, ce qui les rend beaucoup plus faciles à interpréter que les résidus de Martingale lors de la recherche de valeurs aberrantes.

De sorte que "ils semblent avoir un léger biais négatif" dans vos données pourrait être une illusion d'optique. (Vérifiez que le ggcoxdiagnosticstracé n'a pas tronqué l'axe y d'une manière ou d'une autre.)

Les résidus de déviance sont mieux utilisés pour trouver les valeurs aberrantes. Oui, vous avez un large éventail de résidus mais (au moins sur ces parcelles) aucun qui semble outrageusement pire que d'autres.

La page liée souligne également:

Une valeur résiduelle de déviance positive indique une observation selon laquelle l'événement s'est produit plus tôt que prévu; l'inverse est vrai pour le résidu évalué négativement.

Les cas censurés ne peuvent avoir des événements qui se produisent plus tard que prévu. Dans votre deuxième graphique, les résidus de déviance pour les cas censurés sont donc tous négatifs. Les cas avec événements, en revanche, ont des temps d'événements connus de sorte que leurs résidus peuvent être positifs ou négatifs. En plus de l'exigence que le résidu d'écart moyen soit égal à 0, vous obtenez la forme générale de ce graphique.