Interprétation des résultats de GLM
J'essaie de comprendre les résultats d'un glm que j'ai exécuté. Je fais cela pour plusieurs espèces de poissons différentes (une à la fois), pour voir comment le mois, la salinité moyenne, la température, le débit et les précipitations affectent leur abondance. Voici un exemple d'un poisson, j'ai obtenu des résultats similaires avec d'autres espèces.
J'ai utilisé ces données https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing
et ce code pour exécuter un GLM sur une espèce
glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)
#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
trace=1,k=log(nrow(fish_B_all)))
#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin = glm.step.bin
print(summary(glm.final.bin))
#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)
#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)
et le graphique le montre. Qu'est-ce que cela signifie lorsque les résidus et qqplot ressemblent à ceci? Dois-je faire quelque chose pour transformer mes données pour corriger cela?
Réponses
Ces tracés de diagnostic sont conçus pour être utilisés avec des modèles normaux, pas avec des modèles binomiaux.
De plus, lorsque les valeurs de réponse sont toutes 0 et 1, les tracés de diagnostic ressembleront toujours à ceci. Prenez les résidus par rapport aux ajustés. Les résidus sont définis comme$Y_i - \hat Y_i$, donc tous les points de ce graphique auront des coordonnées $(\hat Y_i, \; 0-\hat Y_i)$ quand $Y_i=0$, et $(\hat Y_i, \;1 - \hat Y_i)$ quand $Y_i = 1$. Donc, ces points se trouvent tous le long de deux lignes avec une pente$-1$ et intercepte $0$ et $1$, respectivement. Dans ce graphique particulier, il y a une normalisation supplémentaire, provoquant un décalage et une courbure, mais cela ne l'empêche pas d'afficher deux courbes distinctes correspondant aux 0 et aux 1.
Ne t'inquiète pas.