Interpretazione dei risultati di GLM

Aug 20 2020

Sto cercando di capire i risultati di un glm che ho eseguito. Lo sto facendo per più specie di pesci diverse (una alla volta), per vedere come mese, salinità media, temperatura, portata e pioggia influiscono sulla loro abbondanza. Di seguito è riportato un esempio da un pesce, ho ottenuto risultati simili anche da altre specie.

Ho usato questi dati https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing

e questo codice per eseguire un GLM su una specie

glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
                   data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)

#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
                    trace=1,k=log(nrow(fish_B_all)))

#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin  = glm.step.bin
print(summary(glm.final.bin))

#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)

#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)

e la trama lo mostra .. Cosa significa quando i residui e qqplot hanno questo aspetto? Devo fare qualcosa per trasformare i miei dati per correggerlo?

Risposte

4 RussLenth Aug 21 2020 at 03:41

Questi grafici diagnostici sono progettati per essere utilizzati con modelli normali, non binomiali.

Inoltre, quando i valori di risposta sono tutti 0 e 1, i grafici diagnostici avranno sempre questo aspetto. Prendi i residui rispetto a quelli montati. I residui sono definiti come$Y_i - \hat Y_i$, quindi tutti i punti in questo grafico avranno coordinate $(\hat Y_i, \; 0-\hat Y_i)$ quando $Y_i=0$, e $(\hat Y_i, \;1 - \hat Y_i)$ quando $Y_i = 1$. Quindi questi punti giacciono tutti lungo due linee con pendenza$-1$ e intercetta $0$ e $1$, rispettivamente. In questo particolare grafico, c'è qualche standardizzazione aggiuntiva, che causa uno spostamento e una curvatura, ma ciò non gli impedisce di mostrare due curve distinte corrispondenti agli 0 e agli 1.

Non ti preoccupare.