Interpretación de resultados de GLM
Estoy tratando de entender los resultados de una glm que ejecuté. Estoy haciendo esto para varias especies de peces diferentes (una a la vez), para ver cómo el mes, la salinidad promedio, la temperatura, la descarga y la lluvia afectan su abundancia. A continuación se muestra un ejemplo de un pez, también he obtenido resultados similares de otras especies.
Utilicé estos datos https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing
y este código para ejecutar un GLM en una especie
glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)
#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
trace=1,k=log(nrow(fish_B_all)))
#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin = glm.step.bin
print(summary(glm.final.bin))
#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)
#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)
y el gráfico muestra esto ... ¿Qué significa esto cuando los residuos y qqplot se ven así? ¿Necesito hacer algo para transformar mis datos y corregir esto?

Respuestas
Estos gráficos de diagnóstico están diseñados para su uso con modelos normales, no binomiales.
Además, cuando los valores de respuesta son todos 0 y 1, las gráficas de diagnóstico siempre se verán así. Tome residuales versus ajustados. Los residuos se definen como$Y_i - \hat Y_i$, por lo que todos los puntos de esta gráfica tendrán coordenadas $(\hat Y_i, \; 0-\hat Y_i)$ cuando $Y_i=0$y $(\hat Y_i, \;1 - \hat Y_i)$ cuando $Y_i = 1$. Entonces todos estos puntos se encuentran a lo largo de dos líneas con pendiente$-1$ e intercepta $0$ y $1$, respectivamente. En esta gráfica en particular, hay cierta estandarización adicional, lo que provoca cierto desplazamiento y curvatura, pero eso no impide que muestre dos curvas distintas correspondientes a los 0 y los 1.
No se preocupe por eso.