Menyesuaikan vs mencocokkan [duplikat]

Dec 19 2020

Saya memiliki pertanyaan tentang menyesuaikan vs mencocokkan ketika status perancu sangat berbeda antar kelompok. Misalnya, pria lebih rentan terkena penyakit Parkinson dan penyakit pembuluh darah; sedangkan wanita lebih rentan terhadap penyakit Alzheimer dan MS.

Katakanlah seseorang ingin menilai risiko vaskular untuk Parkinson dan demensia. Dalam hal ini, usia dan jenis kelamin dikenal sebagai perancu yang kuat baik untuk risiko maupun hasil. Haruskah menyesuaikan perancu dalam regresi lebih dapat diandalkan atau cocok?

Saya bertanya karena saya mendapat hasil yang sangat berbeda dalam kohort berbasis populasi sampel yang sangat baik. Di satu sisi, risiko vaskular sangat terkait dengan hasil (OR = 14,4 [5,92,35,2]) tetapi itu benar-benar hilang setelah saya mencocokkan kedua kelompok (penyakit vs bebas penyakit) (OR = 1,29 [0,92,1,82] ). Hasilnya cukup kuat dalam kelompok pencocokan (Saya telah mencoba mencocokkan dengan rasio yang berbeda dan metode yang berbeda beberapa kali).

Saya pribadi berpikir bahwa dengan perbedaan besar dalam usia dan distribusi jenis kelamin, penyesuaian regresi mungkin tidak dapat menjelaskan sepenuhnya. Oleh karena itu, hasil pencocokan lebih dapat diandalkan. Satu bukti untuk itu adalah bahwa setelah pencocokan, PD hanya berkontribusi pada peningkatan 0,1 pada skor risiko vaskular. Oleh karena itu, kecil kemungkinan asosiasi itu nyata.

Jawaban

5 FrankHarrell Dec 19 2020 at 00:23

Secara umum, pencocokan disarankan jika

  • tidak semua data telah dikumpulkan dan Anda ingin menghemat $ atau
  • ukuran yang ingin Anda sesuaikan sulit untuk dimodelkan (biasanya karena memiliki banyak kategori berbeda), misalnya pekerjaan atau kode pos

Situasi Anda mungkin lebih cocok untuk penyesuaian berbasis model, tetapi latihan pemodelan akan mengekspos asumsi tidak adanya interaksi yang perlu Anda buat bergantung pada memiliki data yang tidak seimbang.