Analiza przeżycia, gdy dokładny czas do zdarzenia jest nieznany?

Nov 20 2020

Mój zbiór danych ( przykład tutaj ) przedstawia długoterminowe badanie przechwytywania-znaku-ponownego przechwycenia, trwające około 20 lat. Jestem zainteresowany przyjrzeniem się, jak na przeżycie zwierząt wpływa ich płeć i ekspozycja na patogeny wirusowe . Mam dane na temat wieku zwierząt przy każdym złowieniu, ale technicznie nie mam danych na temat czasu ich śmierci, a raczej jeśli zwierzę nie zostało schwytane w określonym czasie / kolejnych punktach czasowych, albo uniknęło schwytania, albo padło.

Średni wiek zwierząt wynosi <1 rok, ale niektóre osobniki żyją do 7 lat. Stąd w ciągu 20 lat badań kilka tysięcy zwierząt wchodzi i opuszcza populację (oraz wchodzi / wychodzi z badania) w bardzo różnym czasie.

Pytanie: Czy takie dane można wykorzystać w analizie przeżycia przy użyciu modelu proporcjonalnego ryzyka Coxa, krzywych przeżycia Kaplana-Meiera lub podobnych? Jeśli nie, czy ktoś ma jakieś zalecenia, jak podejść do analizy takich danych? (Biorąc pod uwagę interesujące Cię pytania - tekst kursywą powyżej). Zauważ, że nie mam informacji o konkretnym czasie zdarzenia / śmierci.

Do tej pory modelowałem te dane przy użyciu modeli mieszanych z rozkładem gamma, wiekiem jako wynikiem oraz płcią i ekspozycją na patogen jako predyktorami. Nie jestem jednak pewien, czy jest to właściwe podejście. Podczas gdy porównuje się czas, w którym zwierzęta żyły (wiek), nie uwzględnia tempa, w jakim mogły one umrzeć - rozumiem, że analiza przeżycia porównuje zarówno średni czas przeżycia, jak i tempo, w jakim mogła nastąpić śmierć.

Odpowiedzi

3 Cam.Davidson.Pilon Nov 20 2020 at 22:35

Nawet jeśli nie masz zarejestrowanych zdarzeń śmierci (tj. Wszystkie twoje dane są cenzurowane), nadal możesz wyciągać wnioski za pomocą analizy przeżycia. Jest jednak pewien kompromis: nie będzie można użyć żadnych nieparametrycznych ani półparametrycznych modeli. Należą do nich model Kaplana Meiera i model Coxa. Zrezygnowałeś z używania w pełni parametrycznego modelu (niezła rzecz!). Na przykład model Weibulla, Gamma lub splajnu. Wszystkie te zajmują się cenzurowaniem zdarzeń śmierci, nawet 100% cenzurowaniem, i zapewnią oszacowanie współczynników twoich zmiennych towarzyszących, wygenerują średni czas przeżycia itp.

Oprogramowanie:

  • w R jest flexsurvreg
  • w Stata jest merlin
  • w Pythonie jest lifelines(jestem autorem)

Jeśli chcesz, możesz pójść o krok dalej i dołączyć wcześniejsze informacje o długości życia - „średnia wynosi <1 rok, ale czasami nawet 7 lat” - używając parametrycznego modelu bayesowskiego . Zasadniczo wybierasz wyprzedzenia dotyczące nieznanych parametrów, które odzwierciedlają Twoją obecną wiedzę na temat długości życia.