CoxPH에서 이벤트 그룹의 고 분산 잔차
Cox 비례 위험 모델에 맞게 R과 coxph ()를 사용하고 있습니다. 다음을 사용하여 이탈도 잔차를 플로팅 할 때
ggcoxdiagnostics(fit, type = "deviance", linear.predictions = FALSE)
약간 부정적인 편향이있는 것 같습니다.

이벤트가있는 개인이 마지막에 함께 그룹화되도록 데이터를 정렬하면 teir 잔차의 분산이 훨씬 더 높고 약간의 양의 편향이있는 것처럼 보입니다.

에서 동일한 효과를 볼 수 있습니다 type="dfbeta
. Schoenfeld 잔차는 괜찮아 보이고 하나의 변수를 제외하고는 중요하지 않습니다 (p = 0.038). 이것이 예상되는 것입니까?
답변
이 페이지 는 Cox 모델에 대한 다양한 유형의 잔차에 대한 간결한 요약을 제공합니다. 그것이 말한다 :
Martingale 잔차와 달리 이탈 잔차는 평균이 0을 중심으로하므로 이상 치를 찾을 때 Martingale 잔차보다 해석하기가 훨씬 쉽습니다.
데이터에 "약간 부정적인 편향이있는 것처럼 보임"은 착시 현상 일 수 있습니다. ( ggcoxdiagnostics
플롯이 어떤 식 으로든 y 축을 잘랐는 지 확인하십시오 .)
편차 잔차는 특이 치를 찾는 데 가장 적합합니다. 예, 광범위한 잔차가 있지만 (적어도이 그림에서는) 다른 잔차보다 엄청나게 나빠 보이는 잔차가 없습니다.
링크 된 페이지는 또한 다음을 지적합니다.
양수 값의 편차 잔차는 이벤트가 예상보다 빨리 발생한 관찰을 나타냅니다. 그 반대는 음수 값의 잔차에 대해 참입니다.
검열 된 케이스는 예상보다 늦게 발생하는 이벤트 만있는 것으로 확인됩니다 . 따라서 두 번째 그림에서 중도 절단 된 케이스의 이탈도 잔차는 모두 음수입니다. 반대로 이벤트가있는 케이스는 잔차가 양수 또는 음수가 될 수 있도록 이벤트 시간을 알고 있습니다. 평균 편차 잔차가 0이라는 요구 사항과 함께 해당 그림의 일반적인 모양을 얻습니다.