Menafsirkan hasil dari GLM

Aug 20 2020

Saya mencoba untuk memahami hasil dari glm yang saya jalankan. Saya melakukan ini untuk beberapa spesies ikan yang berbeda (satu per satu), untuk melihat bagaimana bulan, salinitas rata-rata, suhu, debit, dan curah hujan memengaruhi kelimpahan mereka. Di bawah ini adalah contoh dari satu ikan, saya mendapatkan hasil yang serupa dari spesies lain juga.

Saya menggunakan data ini https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing

dan kode ini untuk menjalankan GLM pada satu spesies

glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
                   data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)

#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
                    trace=1,k=log(nrow(fish_B_all)))

#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin  = glm.step.bin
print(summary(glm.final.bin))

#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)

#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)

dan plot menunjukkan ini .. Apa artinya jika residual dan qqplot terlihat seperti ini? Apakah saya perlu melakukan sesuatu untuk mengubah data saya untuk memperbaikinya?

Jawaban

4 RussLenth Aug 21 2020 at 03:41

Plot diagnostik ini dirancang untuk digunakan dengan model normal, bukan model binomial.

Selain itu, jika nilai respons semuanya 0 dan 1, plot diagnostik akan selalu terlihat seperti ini. Ambil sisa versus pas. Residu didefinisikan sebagai$Y_i - \hat Y_i$, jadi semua titik dalam plot ini akan memiliki koordinat $(\hat Y_i, \; 0-\hat Y_i)$ kapan $Y_i=0$, dan $(\hat Y_i, \;1 - \hat Y_i)$ kapan $Y_i = 1$. Jadi semua titik ini terletak di sepanjang dua garis dengan kemiringan$-1$ dan penyadapan $0$ dan $1$, masing-masing. Dalam plot khusus ini, ada beberapa standardisasi tambahan, menyebabkan beberapa pergeseran dan kelengkungan, tetapi itu tidak menghentikannya untuk menunjukkan dua kurva berbeda yang sesuai dengan 0 dan 1.

Jangan khawatir tentang itu.