CoxPHのイベントグループの高分散残余

Nov 26 2020

コックス比例ハザードモデルに合わせるためにRとcoxph()を使用しています。を使用して逸脱度残差をプロットすると

ggcoxdiagnostics(fit, type = "deviance", linear.predictions = FALSE)

それらはわずかに負のバイアスを持っているように見えます。

イベントが発生した個人が最後にグループ化されるようにデータを並べ替えると、teir残差の分散がはるかに大きくなり、わずかに正のバイアスがあるように見えます。

についても同じ効果が見られtype="dfbetaます。シェーンフェルトの残差は見栄えがよく、1つの変数(p = 0.038)を除いて有意ではありません。これは予想されることですか?

回答

1 EdM Nov 27 2020 at 23:31

このページでは、Coxモデルのさまざまなタイプの残差の簡潔な要約を提供します。それが言うように:

マルチンゲール残差とは異なり、逸脱度残差は0を中心とする平均であるため、外れ値を探す場合、マルチンゲール残差よりもはるかに簡単に解釈できます。

そのため、データに「わずかに負のバイアスがあるように見える」というのは目の錯覚かもしれません。(ggcoxdiagnosticsプロットが何らかの方法でy軸を切り捨てていないことを確認してください。)

逸脱度残差は、外れ値を見つけるために最もよく使用されます。はい、あなたには広範囲の残余がありますが、(少なくともこれらのプロットでは)他のものよりも法外に悪いように見えるものはありません。

リンク先のページも指摘しています:

正の値の逸脱度残差は、イベントが予測よりも早く発生したという観察結果を示しています。負の値の残差については、その逆が当てはまります。

打ち切られたケースは、予測よりも遅れて発生するイベントがあることがわかります。したがって、2番目のプロットでは、打ち切られたケースの逸脱度残差はすべて負になります。対照的に、イベントのあるケースでは、イベント時間がわかっているため、残差は正または負になります。平均逸脱度残差が0であるという要件とともに、そのプロットの一般的な形状を取得します。