Überlebensanalyse bei genauer Zeit bis zum Ereignis unbekannt?

Nov 20 2020

Mein Datensatz ( Beispiel hier ) repräsentiert eine Langzeitstudie zur Erfassung und Wiedererfassung von Markierungen mit einer Dauer von ungefähr 20 Jahren. Ich bin daran interessiert zu untersuchen, wie das Überleben von Tieren durch ihr Geschlecht und die Exposition gegenüber viralen Krankheitserregern beeinflusst wird . Ich habe Daten zum Alter der Tiere bei jeder Gefangennahme, aber technisch gesehen keine Daten zum Zeitpunkt ihres Todes. Wenn ein Tier nicht zu einem bestimmten Zeitpunkt / zu aufeinanderfolgenden Zeitpunkten gefangen wird, ist es entweder der Gefangennahme entgangen oder gestorben.

Das Durchschnittsalter der Tiere beträgt <1 Jahr, aber einige Personen leben bis zu 7 Jahre. Während des 20-jährigen Untersuchungszeitraums treten mehrere tausend Tiere zu sehr unterschiedlichen Zeiten in die Population ein und aus (und treten in die Studie ein / aus).

Frage: Können solche Daten in der Überlebensanalyse unter Verwendung eines Cox-Proportional-Hazards-Modells, Kaplan-Meier-Überlebenskurven oder ähnlichem verwendet werden? Wenn nicht, hat jemand Empfehlungen, wie man mit der Analyse solcher Daten umgehen könnte? (In Anbetracht der Frage (n) von Interesse - kursiver Text oben). Beachten Sie, dass ich keine Informationen zum genauen Zeitpunkt des Ereignisses / Todes habe.

Bisher habe ich diese Daten mit gemischten Modellen mit einer Gammaverteilung, dem Alter als Ergebnis und der Exposition von Geschlecht und Krankheitserregern als Prädiktoren modelliert. Ich bin jedoch nicht sicher, ob dies der richtige Ansatz ist. Während dies die Zeit vergleicht, zu der die Tiere lebten (Alter), berücksichtigt es nicht die Rate, mit der sie möglicherweise gestorben sind - ich verstehe, dass die Überlebensanalyse sowohl die mittlere Überlebenszeit als auch die Rate vergleicht, mit der der Tod aufgetreten sein könnte.

Antworten

3 Cam.Davidson.Pilon Nov 20 2020 at 22:35

Auch wenn Sie keine Todesereignisse aufgezeichnet haben (dh alle Ihre Daten werden zensiert), können Sie mithilfe der Überlebensanalyse dennoch Schlussfolgerungen ziehen. Es gibt jedoch einen Kompromiss: Sie können keine nicht parametrischen oder semiparametrischen Modelle verwenden. Dazu gehören das Kaplan-Meier-Modell und das Cox-Modell. Sie sind zurückgetreten, um ein vollständig parametrisches Modell zu verwenden (keine schlechte Sache!). Zum Beispiel ein Weibull- oder ein Gamma-Modell oder ein Spline-Modell. Alle diese Funktionen behandeln die Zensur von Todesereignissen, sogar die 100% ige Zensur, und liefern Koeffizientenschätzungen Ihrer Kovariaten, ergeben mittlere Überlebenszeiten usw.

Software:

  • in R gibt es flexsurvreg
  • in Stata gibt es merlin
  • in Python gibt es lifelines(ich bin der Autor)

Wenn Sie möchten, können Sie einen Schritt weiter gehen und die vorherigen Informationen über die Lebensdauer - "Mittelwert ist <1 Jahr, manchmal aber auch bis zu 7 Jahre" - mithilfe eines Bayes'schen parametrischen Modells angeben. Grundsätzlich wählen Sie Prioritäten für unbekannte Parameter aus, die Ihr aktuelles Wissen über die Lebensdauer widerspiegeln.