Регулировка и соответствие [дубликат]
У меня есть вопрос относительно корректировки и сопоставления, когда смешивающий статус сильно различается между группами. Например, мужчины более склонны к болезни Паркинсона и сосудистым заболеваниям; тогда как женщины более восприимчивы к болезни Альцгеймера и РС.
Скажите, что кто-то хочет оценить сосудистый риск болезни Паркинсона и деменции. В этом случае, как известно, возраст и пол сильно влияют как на риск, так и на результат. Что должно быть более надежным - корректировать конфаундер в регрессии?
Я спрашиваю, потому что у меня были очень разные результаты в очень хорошо отобранной когорте населения. С одной стороны, сосудистый риск был сильно связан с исходами (OR = 14,4 [5,92,35,2]), но он полностью исчез после того, как я сопоставил две группы (заболевание или отсутствие заболевания) (OR = 1,29 [0,92,1,82] ). Результаты были довольно надежными в группах сопоставления (я несколько раз пытался сопоставить с разными соотношениями и разными методами).
Я лично считаю, что при большой разнице в распределении по возрасту и полу регрессионная поправка не сможет полностью учесть искажение. Следовательно, результаты сопоставления более надежны. Одним из свидетельств этого является то, что после сопоставления PD вносит вклад только в 0,1 балла в оценке сосудистого риска. Поэтому маловероятно, что ассоциация была реальной.
Ответы
Вообще говоря, соответствие предлагается, если
- не все данные были собраны, и вы хотите сэкономить $ или
- измерения, которые вы хотите настроить, сложно смоделировать (обычно из-за большого количества различных категорий), например род занятий или почтовый индекс
Ваша ситуация может быть более подходящей для корректировки на основе модели, но упражнение по моделированию выявит предположения об отсутствии взаимодействия, которые вам необходимо будет сделать в зависимости от наличия несбалансированных данных.