Wie kann man ein Ereignis für verschiedene Zeitintervalle vorhersagen und die Punktzahl berechnen?
Angenommen, ich habe einen medizinischen Datensatz / EHR-Datensatz, der retrospektiv und in Längsrichtung angelegt ist. Das heißt, eine Person hat mehrere Messungen zu mehreren Zeitpunkten (in der Vergangenheit).
Dieser Datensatz enthält Informationen zur Diagnose des Patienten, zu Labors, Aufnahmen und zum Konsum von Medikamenten usw.
Wenn ich nun Prädiktoren herausfinden möchte, die die Mortalität beeinflussen können, kann ich die logistische Regression verwenden (ob der Patient sterben wird oder nicht).
Mein Ziel ist es jedoch herauszufinden, welche Prädiktoren mir helfen können, vorherzusagen, ob eine Person in den nächsten 30 Tagen oder in den nächsten 240 Tagen sterben wird. Wie kann ich dies mithilfe von ML / Datenanalysetechniken tun?
Darüber hinaus möchte ich auch eine Punktzahl berechnen, die die Wahrscheinlichkeit angibt, dass diese Person in den nächsten 30 Tagen sterben wird. Wie kann ich die Punktzahlen berechnen? Irgendein Tutorial, bitte?
Können Sie uns bitte dabei helfen?
Antworten
Wie in Ihrer verwandten Frage erläutert , wird dies leicht durch eine Überlebensanalyse erreicht, die die Zeiten explizit für Ereignisse modelliert. Der Trick besteht darin, zu definieren time = 0
, anhand derer die Überlebenszeiten bewertet werden sollen, insbesondere wenn Sie dieselbe Person über mehrere potenzielle Startzeiten hinweg verfolgt haben. Analyseansätze hängen auch von der Art des Ereignisses ab: Der Tod tritt einmal pro Person auf, aber Krankenhauseinweisungen können für dieselbe Person viele Male auftreten, und Sie müssten die intraindividuellen Assoziationen zwischen Ereignissen berücksichtigen.
Die mit dem survivalPaket in R gelieferten Vignetten bieten eine gute Einführung in die Prinzipien, selbst wenn Sie einen anderen Ansatz für maschinelles Lernen verwenden.