調整とマッチング[重複]

Dec 19 2020

交絡状態がグループ間で大きく異なる場合の調整とマッチングについて質問があります。たとえば、男性はパーキンソン病や血管疾患にかかりやすい傾向があります。一方、女性はアルツハイマー病と多発性硬化症にかかりやすいです。

パーキンソン病と認知症に対する血管のリスクを評価したいとします。この場合、年齢と性別がリスクと結果の両方の強力な交絡因子であることが知られています。回帰の交絡因子をより信頼性の高いものにするか、一致させる必要がありますか?

非常によくサンプリングされた母集団ベースのコホートで非常に異なる結果が得られたので、私は尋ねています。一方では、血管リスクは転帰と高度に関連していたが(OR = 14.4 [5.92,35.2])、2つのグループ(無病vs無病)を一致させた後、完全になくなった(OR = 1.29 [0.92,1.82])。 )。結果は、マッチンググループでかなり堅牢でした(さまざまな比率とさまざまな方法で何度かマッチングを試みました)。

個人的には、年齢や性別の分布が大きく異なるため、回帰調整では交絡を十分に説明できない可能性があると思います。したがって、マッチングの結果はより信頼性が高くなります。それに対する1つの証拠は、マッチング後、PDは血管リスクのスコアの0.1の増加にのみ寄与するということです。したがって、関連付けが本物であった可能性は低いです。

回答

5 FrankHarrell Dec 19 2020 at 00:23

一般的に言って、マッチングは次の場合に提案されます

  • すべてのデータが収集されたわけではなく、$またはを節約したい
  • 調整したい測定値はモデル化が困難です(通常、職業や郵便番号などの異なるカテゴリが多数あるため)。

あなたの状況はモデルベースの調整により適しているかもしれませんが、モデリングの演習では、不均衡なデータがあることに応じて行う必要のある相互作用がないという仮定が明らかになります。