Interpretation der Ergebnisse von GLM

Aug 20 2020

Ich versuche, die Ergebnisse eines von mir durchgeführten Glm zu verstehen. Ich mache dies für mehrere verschiedene Fischarten (eine nach der anderen), um zu sehen, wie sich Monat, durchschnittlicher Salzgehalt, Temperatur, Abfluss und Niederschlag auf ihre Häufigkeit auswirken. Unten ist ein Beispiel von einem Fisch, ich habe ähnliche Ergebnisse auch von anderen Arten erhalten.

Ich habe diese Daten verwendet https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing

und dieser Code, um eine GLM für eine Art auszuführen

glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
                   data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)

#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
                    trace=1,k=log(nrow(fish_B_all)))

#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin  = glm.step.bin
print(summary(glm.final.bin))

#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)

#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)

und das Diagramm zeigt dies. Was bedeutet das, wenn die Residuen und das qqplot so aussehen? Muss ich etwas tun, um meine Daten zu transformieren, um dies zu korrigieren?

Antworten

4 RussLenth Aug 21 2020 at 03:41

Diese Diagnosediagramme sind für die Verwendung mit normalen Modellen vorgesehen, nicht mit binomialen.

Wenn die Antwortwerte alle Nullen und Einsen sind, sehen die Diagnosediagramme außerdem immer so aus. Nehmen Sie Residuen gegen angepasste. Die Residuen sind definiert als$Y_i - \hat Y_i$Daher haben alle Punkte in diesem Diagramm Koordinaten $(\hat Y_i, \; 0-\hat Y_i)$ wann $Y_i=0$, und $(\hat Y_i, \;1 - \hat Y_i)$ wann $Y_i = 1$. Diese Punkte liegen also alle entlang zweier Linien mit Steigung$-1$ und fängt ab $0$ und $1$, beziehungsweise. In diesem speziellen Diagramm gibt es eine zusätzliche Standardisierung, die eine gewisse Verschiebung und Krümmung verursacht, die jedoch nicht daran hindert, zwei unterschiedliche Kurven anzuzeigen, die den Nullen und Einsen entsprechen.

Mach dir keine Sorgen.