Dopasowywanie a dopasowywanie [duplikat]
Mam pytanie dotyczące dopasowywania i dopasowywania, gdy sytuacja myląca jest bardzo różna między grupami. Na przykład mężczyźni są bardziej podatni na chorobę Parkinsona i choroby naczyniowe; podczas gdy kobiety są bardziej podatne na chorobę Alzheimera i SM.
Powiedz, że chce się ocenić naczyniowe ryzyko choroby Parkinsona i demencji. W tym przypadku wiadomo, że wiek i płeć są silnym czynnikiem zakłócającym zarówno ryzyko, jak i wynik. Czy dostosowanie elementu zakłócającego w regresji powinno być bardziej wiarygodne czy dopasowane?
Pytam, ponieważ uzyskałem bardzo różne wyniki w bardzo dobrze dobranej kohorcie populacyjnej. Z jednej strony ryzyko naczyniowe było silnie związane z wynikami (OR = 14,4 [5,92,35,2]), ale całkowicie zniknęło po dopasowaniu dwóch grup (choroba vs brak choroby) (OR = 1,29 [0,92,1,82] ). Wyniki były dość solidne w dopasowanych grupach (kilkakrotnie próbowałem dopasować różne współczynniki i różne metody).
Osobiście uważam, że przy dużej różnicy w rozkładzie wieku i płci, korekta regresji może nie być w stanie w pełni wyjaśnić pomyłki. Dlatego wyniki dopasowania są bardziej wiarygodne. Jednym z dowodów na to jest to, że po dopasowaniu PD przyczynia się tylko do wzrostu o 0,1 w skali ryzyka naczyniowego. Dlatego jest mało prawdopodobne, aby skojarzenie było prawdziwe.
Odpowiedzi
Ogólnie rzecz biorąc, dopasowanie jest sugerowane, jeśli
- nie wszystkie dane zostały zebrane i chcesz zaoszczędzić $ lub
- wymiary, do których chcesz się dostosować, są trudne do modelowania (zwykle ze względu na dużą liczbę odrębnych kategorii), np. zawód lub kod pocztowy
Twoja sytuacja może być bardziej odpowiednia do dostosowania opartego na modelu, ale ćwiczenie modelowania ujawni założenia dotyczące braku interakcji, które musiałbyś przyjąć w zależności od niezrównoważonych danych.