Reszty o dużej wariancji w grupie zdarzeń w CoxPH

Nov 26 2020

Używam R i coxph (), aby dopasować model proporcjonalnego hazardu Coxa. Kiedy wykreślam reszty odchyleń za pomocą

ggcoxdiagnostics(fit, type = "deviance", linear.predictions = FALSE)

wydają się mieć niewielkie negatywne nastawienie.

Jeśli posortuję moje dane w taki sposób, że osoby, które miały zdarzenie, są na końcu zgrupowane razem, zauważam, że reszty teir mają znacznie większą wariancję i wydają się mieć niewielką pozytywną stronniczość:

Widzę ten sam efekt type="dfbeta. Reszty Schoenfelda wyglądają dobrze i są nieistotne z wyjątkiem jednej zmiennej (p = 0,038). Czy tego można się spodziewać?

Odpowiedzi

1 EdM Nov 27 2020 at 23:31

Ta strona zawiera zwięzłe podsumowanie różnych typów reszt dla modeli Coxa. Jak mówi:

W przeciwieństwie do reszt martyngałowych, reszty odchyleń są średnią wyśrodkowaną wokół 0, co znacznie ułatwia ich interpretację niż reszty Martingale podczas wyszukiwania wartości odstających.

Zatem „wydają się mieć nieznaczne negatywne odchylenie” w twoich danych może być złudzeniem optycznym. (Sprawdź, czy ggcoxdiagnosticswykres nie obciął w jakiś sposób osi Y).

Do znajdowania wartości odstających najlepiej używać reszt odchylenia. Tak, masz szeroki zakres pozostałości, ale (przynajmniej na tych działkach) żadne z nich nie wydają się skandalicznie gorsze od innych.

Podlinkowana strona wskazuje również:

Wartość reszty odchylenia o wartości dodatniej wskazuje na obserwację, zgodnie z którą zdarzenie wystąpiło wcześniej niż przewidywano; sytuacja odwrotna dotyczy wartości rezydualnej o ujemnej wartości.

W przypadku ocenzurowanych przypadków można stwierdzić, że zdarzenia występują później niż przewidywano. Na twoim drugim wykresie wszystkie odchylenia dla przypadków ocenzurowanych są zatem ujemne. Natomiast przypadki ze zdarzeniami mają znane czasy zdarzeń, więc ich reszty mogą być dodatnie lub ujemne. Wraz z wymaganiem, aby średnia reszta odchylenia wynosiła 0, otrzymujesz ogólny kształt tego wykresu.