Menafsirkan hasil dari GLM
Saya mencoba untuk memahami hasil dari glm yang saya jalankan. Saya melakukan ini untuk beberapa spesies ikan yang berbeda (satu per satu), untuk melihat bagaimana bulan, salinitas rata-rata, suhu, debit, dan curah hujan memengaruhi kelimpahan mereka. Di bawah ini adalah contoh dari satu ikan, saya mendapatkan hasil yang serupa dari spesies lain juga.
Saya menggunakan data ini https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing
dan kode ini untuk menjalankan GLM pada satu spesies
glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)
#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
trace=1,k=log(nrow(fish_B_all)))
#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin = glm.step.bin
print(summary(glm.final.bin))
#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)
#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)
dan plot menunjukkan ini .. Apa artinya jika residual dan qqplot terlihat seperti ini? Apakah saya perlu melakukan sesuatu untuk mengubah data saya untuk memperbaikinya?

Jawaban
Plot diagnostik ini dirancang untuk digunakan dengan model normal, bukan model binomial.
Selain itu, jika nilai respons semuanya 0 dan 1, plot diagnostik akan selalu terlihat seperti ini. Ambil sisa versus pas. Residu didefinisikan sebagai$Y_i - \hat Y_i$, jadi semua titik dalam plot ini akan memiliki koordinat $(\hat Y_i, \; 0-\hat Y_i)$ kapan $Y_i=0$, dan $(\hat Y_i, \;1 - \hat Y_i)$ kapan $Y_i = 1$. Jadi semua titik ini terletak di sepanjang dua garis dengan kemiringan$-1$ dan penyadapan $0$ dan $1$, masing-masing. Dalam plot khusus ini, ada beberapa standardisasi tambahan, menyebabkan beberapa pergeseran dan kelengkungan, tetapi itu tidak menghentikannya untuk menunjukkan dua kurva berbeda yang sesuai dengan 0 dan 1.
Jangan khawatir tentang itu.