Interpretando os resultados do GLM
Estou tentando entender os resultados de um glm que executei. Estou fazendo isso para várias espécies de peixes diferentes (uma de cada vez), para ver como o mês, a salinidade média, a temperatura, a descarga e as chuvas impactam sua abundância. Abaixo está um exemplo de um peixe, obtive resultados semelhantes de outras espécies também.
Eu usei esses dados https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing
e este código para executar um GLM em uma espécie
glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)
#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
trace=1,k=log(nrow(fish_B_all)))
#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin = glm.step.bin
print(summary(glm.final.bin))
#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)
#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)
e o gráfico mostra isso .. O que isso significa quando os resíduos e qqplot se parecem com isso? Eu preciso fazer algo para transformar meus dados para corrigir isso?
Respostas
Esses gráficos de diagnóstico são projetados para uso com modelos normais, não binomiais.
Além disso, quando os valores de resposta são todos 0s e 1s, os gráficos de diagnóstico sempre terão esta aparência. Pegue os residuais e os ajustados. Os resíduos são definidos como$Y_i - \hat Y_i$, então todos os pontos neste gráfico terão coordenadas $(\hat Y_i, \; 0-\hat Y_i)$ quando $Y_i=0$e $(\hat Y_i, \;1 - \hat Y_i)$ quando $Y_i = 1$. Então, todos esses pontos estão ao longo de duas linhas com inclinação$-1$ e intercepta $0$ e $1$, respectivamente. Neste gráfico específico, há alguma padronização adicional, causando algum deslocamento e curvatura, mas isso não o impede de mostrar duas curvas distintas correspondentes aos 0s e aos 1s.
Não se preocupe com isso.