Интерпретация результатов GLM

Aug 20 2020

Я пытаюсь понять результаты запуска glm. Я делаю это для нескольких разных видов рыб (по одному), чтобы увидеть, как месяц, средняя соленость, температура, расход и осадки влияют на их численность. Ниже приведен пример для одной рыбы, я получил аналогичные результаты и для других видов.

Я использовал эти данные https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing

и этот код для запуска GLM на одном виде

glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
                   data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)

#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
                    trace=1,k=log(nrow(fish_B_all)))

#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin  = glm.step.bin
print(summary(glm.final.bin))

#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)

#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)

и график показывает это .. Что это означает, когда остатки и qqplot выглядят так? Нужно ли мне что-то делать, чтобы преобразовать мои данные, чтобы исправить это?

Ответы

4 RussLenth Aug 21 2020 at 03:41

Эти диагностические графики предназначены для использования с обычными моделями, а не с биномиальными.

Более того, когда все значения ответа равны 0 и 1, диагностические графики всегда будут выглядеть примерно так. Возьмите остатки в сравнении с подогнанными. Остатки определяются как$Y_i - \hat Y_i$, поэтому все точки на этом графике будут иметь координаты $(\hat Y_i, \; 0-\hat Y_i)$ когда $Y_i=0$, и $(\hat Y_i, \;1 - \hat Y_i)$ когда $Y_i = 1$. Все эти точки лежат на двух линиях с наклоном$-1$ и перехватывает $0$ и $1$соответственно. В этом конкретном графике есть некоторая дополнительная стандартизация, вызывающая некоторое смещение и искривление, но это не мешает ему показывать две отдельные кривые, соответствующие нулю и единице.

Не беспокойся об этом.