Interpretacja wyników z GLM
Próbuję zrozumieć wyniki z glm, które przeprowadziłem. Robię to dla wielu różnych gatunków ryb (po jednej na raz), aby zobaczyć, jak miesiąc, średnie zasolenie, temperatura, zrzut i opady wpływają na ich liczebność. Poniżej znajduje się przykład z jednej ryby, podobne wyniki uzyskałem również z innych gatunków.
Wykorzystałem te dane https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing
i ten kod do uruchamiania GLM na jednym gatunku
glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)
#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
trace=1,k=log(nrow(fish_B_all)))
#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin = glm.step.bin
print(summary(glm.final.bin))
#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)
#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)
a wykres pokazuje to .. Co to oznacza, gdy reszty i qqplot wyglądają tak? Czy muszę coś zrobić, aby przekształcić moje dane, aby to poprawić?
Odpowiedzi
Te wykresy diagnostyczne są przeznaczone do użytku z normalnymi modelami, a nie modelami dwumianowymi.
Co więcej, gdy wszystkie wartości odpowiedzi wynoszą 0 i 1, wykresy diagnostyczne zawsze będą wyglądać mniej więcej tak. Weź reszty w porównaniu z dopasowanymi. Reszty są zdefiniowane jako$Y_i - \hat Y_i$, więc wszystkie punkty na tym wykresie będą miały współrzędne $(\hat Y_i, \; 0-\hat Y_i)$ gdy $Y_i=0$, i $(\hat Y_i, \;1 - \hat Y_i)$ gdy $Y_i = 1$. Więc wszystkie te punkty leżą wzdłuż dwóch linii ze spadkiem$-1$ i przechwyty $0$ i $1$odpowiednio. W tym konkretnym wykresie istnieje dodatkowa standaryzacja, powodująca pewne przesunięcia i krzywizny, ale to nie powstrzymuje go przed pokazaniem dwóch różnych krzywych odpowiadających zerom i jedynkom.
Nie martw się tym.