Ajustement et correspondance [dupliquer]
J'ai une question concernant l'ajustement par rapport à l'appariement lorsque l'état de confusion est largement différent entre les groupes. Par exemple, les hommes sont plus sujets à la maladie de Parkinson et aux maladies vasculaires; tandis que les femmes sont plus sensibles à la maladie d'Alzheimer et à la SP.
Disons que l'on souhaite évaluer le risque vasculaire de Parkinson et de démence. Dans ce cas, l'âge et le sexe sont connus pour être de puissants facteurs de confusion à la fois du risque et du résultat. L'ajustement du facteur de confusion dans la régression devrait-il être plus fiable ou correspondant?
Je pose la question parce que j'ai obtenu des résultats très différents dans une cohorte de population très bien échantillonnée. D'une part, le risque vasculaire était fortement associé aux résultats (OR = 14,4 [5,92,35,2]), mais il avait complètement disparu après avoir apparié les deux groupes (maladie vs sans maladie) (OR = 1,29 [0,92,1,82] ). Les résultats étaient assez robustes dans les groupes correspondants (j'ai essayé plusieurs fois de faire correspondre différents ratios et différentes méthodes).
Personnellement, je pense qu'avec une grande différence dans la répartition par âge et par sexe, l'ajustement de la régression peut ne pas être en mesure de tenir pleinement compte de la confusion. Par conséquent, les résultats de l'appariement sont plus fiables. Une preuve à cela est qu'après appariement, le PD ne contribue qu'à une augmentation de 0,1 sur le score de risque vasculaire. Par conséquent, il est peu probable que l'association était réelle.
Réponses
De manière générale, l'appariement est suggéré si
- toutes les données n'ont pas été collectées et vous souhaitez économiser $ ou
- les mesures que vous souhaitez ajuster sont difficiles à modéliser (généralement en raison du grand nombre de catégories distinctes), par exemple la profession ou le code postal
Votre situation peut être plus appropriée pour un ajustement basé sur un modèle, mais l'exercice de modélisation exposera les hypothèses d'absence d'interaction que vous auriez besoin de faire en fonction du déséquilibre des données.