การตีความผลลัพธ์จาก GLM

Aug 20 2020

ฉันพยายามเข้าใจผลลัพธ์จาก glm ที่ฉันวิ่ง ฉันกำลังทำสิ่งนี้กับปลาหลาย ๆ ชนิด (ทีละตัว) เพื่อดูว่าเดือนความเค็มเฉลี่ยอุณหภูมิการปล่อยและปริมาณน้ำฝนส่งผลต่อความอุดมสมบูรณ์ของพวกมันอย่างไร ด้านล่างเป็นตัวอย่างจากปลาตัวหนึ่งฉันได้ผลลัพธ์ที่คล้ายกันจากสปีชีส์อื่นเช่นกัน

ฉันใช้ข้อมูลนี้ https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing

และรหัสนี้เพื่อเรียกใช้ GLM ในสปีชีส์หนึ่ง

glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
                   data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)

#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
                    trace=1,k=log(nrow(fish_B_all)))

#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin  = glm.step.bin
print(summary(glm.final.bin))

#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)

#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)

และพล็อตก็แสดงให้เห็น .. นี่หมายความว่าอย่างไรเมื่อส่วนที่เหลือและ qqplot มีลักษณะเช่นนี้? ฉันต้องทำอะไรบางอย่างเพื่อแปลงข้อมูลเพื่อแก้ไขปัญหานี้หรือไม่

คำตอบ

4 RussLenth Aug 21 2020 at 03:41

แผนผังการวินิจฉัยเหล่านี้ออกแบบมาเพื่อใช้กับแบบจำลองปกติไม่ใช่แบบทวินาม

ยิ่งไปกว่านั้นเมื่อค่าตอบกลับเป็น 0 และ 1 ทั้งหมดพล็อตการวินิจฉัยจะมีลักษณะเช่นนี้เสมอ นำเศษวัสดุที่เหลือมาเทียบกับการติดตั้ง ส่วนที่เหลือถูกกำหนดเป็น$Y_i - \hat Y_i$ดังนั้นจุดทั้งหมดในพล็อตนี้จะมีพิกัด $(\hat Y_i, \; 0-\hat Y_i)$ เมื่อไหร่ $Y_i=0$และ $(\hat Y_i, \;1 - \hat Y_i)$ เมื่อไหร่ $Y_i = 1$. จุดเหล่านี้จึงอยู่ตามเส้นสองเส้นที่มีความชัน$-1$ และสกัดกั้น $0$ และ $1$ตามลำดับ ในพล็อตเฉพาะนี้มีการกำหนดมาตรฐานเพิ่มเติมทำให้มีการขยับและความโค้ง แต่นั่นไม่ได้หยุดไม่ให้แสดงเส้นโค้งสองเส้นที่แตกต่างกันซึ่งสอดคล้องกับ 0 และ 1

อย่าเพิ่งกังวลไป