GLM의 결과 해석

Aug 20 2020

나는 내가 달렸던 glm의 결과를 이해하려고 노력하고 있습니다. 저는 여러 다른 어종 (한 번에 하나씩)에 대해이 작업을 수행하여 월, 평균 염도, 온도, 배출량 및 강우량이 그들의 풍요에 미치는 영향을 확인합니다. 아래는 한 물고기의 예이며 다른 종에서도 비슷한 결과를 얻었습니다.

이 데이터를 사용했습니다 https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing

한 종에서 GLM을 실행하는이 코드

glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
                   data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)

#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
                    trace=1,k=log(nrow(fish_B_all)))

#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin  = glm.step.bin
print(summary(glm.final.bin))

#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)

#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)

그리고 플롯은 이것을 보여줍니다 .. 잔차와 qqplot이 다음과 같을 때 이것은 무엇을 의미합니까? 이 문제를 해결하기 위해 데이터를 변환해야합니까?

답변

4 RussLenth Aug 21 2020 at 03:41

이 진단 플롯은 이항 모델이 아닌 정규 모델과 함께 사용하도록 설계되었습니다.

또한 응답 값이 모두 0과 1이면 진단 플롯은 항상 이와 같이 보입니다. 잔차 대 적합치를 취하십시오. 잔차는 다음과 같이 정의됩니다.$Y_i - \hat Y_i$, 따라서이 플롯의 모든 점은 좌표를 갖게됩니다. $(\hat Y_i, \; 0-\hat Y_i)$ 언제 $Y_i=0$, 및 $(\hat Y_i, \;1 - \hat Y_i)$ 언제 $Y_i = 1$. 따라서이 점은 모두 경사가있는 두 선을 따라 놓여 있습니다.$-1$ 및 차단 $0$$1$, 각각. 이 특정 플롯에는 약간의 이동 및 곡률을 유발하는 추가 표준화가 있지만 0과 1에 해당하는 두 개의 별개 곡선을 표시하는 것을 막지는 않습니다.

그것에 대해 걱정하지 마십시오.