Comment prédire un événement pour différents intervalles de temps et calculer le score?
Disons que j'ai un ensemble de données médicales / DSE qui est de nature rétrospective et longitudinale. Cela signifie qu'une personne a plusieurs mesures sur plusieurs points temporels (dans le passé).
Cet ensemble de données contient des informations sur le diagnostic des patients, les laboratoires, les admissions et les médicaments consommés, etc.
Maintenant, si je souhaite trouver des prédicteurs qui peuvent influencer la mortalité, je peux utiliser la régression logistique (que le patient mourra ou non).
Mais mon objectif est de découvrir quels sont les prédicteurs qui peuvent m'aider à prédire si une personne mourra dans les 30 prochains jours ou les 240 prochains jours, comment puis-je faire cela en utilisant les techniques ML / Data Analysis?
En outre, je voudrais également calculer un score qui peut indiquer la probabilité que cette personne décède dans les 30 prochains jours? Comment puis-je calculer les scores? Un tutoriel, s'il vous plaît?
Pouvez-vous m'aider s'il vous plaît?
Réponses
Comme discuté dans votre question connexe , cela est facilement accompli via l'analyse de survie, qui modélise explicitement les temps en événements. L'astuce consiste à définir à time = 0
partir de laquelle évaluer les temps de survie, en particulier lorsque vous avez suivi le même individu sur plusieurs heures de début potentielles. Les approches d'analyse dépendraient également du type d'événement: le décès survient une fois par personne, mais les réadmissions à l'hôpital peuvent se produire plusieurs fois pour la même personne et il faudrait prendre en compte les associations intra-individuelles entre les événements.
Les vignettes fournies avec le survivalpackage dans R fournissent une bonne introduction aux principes même si vous finissez par utiliser une approche d'apprentissage automatique différente.