GLMからの結果の解釈
実行したglmの結果を理解しようとしています。私はこれを複数の異なる魚種に対して(一度に1つずつ)行って、月、平均塩分、温度、流量、および降雨がそれらの豊度にどのように影響するかを確認しています。以下は1匹の魚の例ですが、他の種でも同様の結果が得られています。
このデータを使用しました https://drive.google.com/file/d/1Swp0rEFeaInGD4kA1h3xZReFNtho6JPz/view?usp=sharing
1つの種でGLMを実行するためのこのコード
glm.full.bin = glm(binom~Month +Salinity +Temperature +Discharge.x +Rainfall.x,
data=fish_B_all,family=binomial)
glm.base.bin = glm(binom~Month,data=fish_B_all,family=binomial)
#step to simplify model and get appropriate order
glm.step.bin = step(glm.base.bin,scope=list(upper=glm.full.bin,lower=~Month),direction='forward',
trace=1,k=log(nrow(fish_B_all)))
#final model - may choose to reduce based on deviance and cutoff in above step
glm.final.bin = glm.step.bin
print(summary(glm.final.bin))
#calculate the LSMeans for the proportion of positive trips
lsm.b.glm = emmeans(glm.final.bin,"Month",data=fish_B_all)
LSMeansProp = summary(lsm.b.glm)
#plot model
par(mfrow=c(2,2))
plot(glm.final.bin)
プロットはこれを示しています。残差とqqplotがこのように見える場合、これはどういう意味ですか?これを修正するためにデータを変換するために何かをする必要がありますか?

回答
これらの診断プロットは、二項モデルではなく、通常のモデルで使用するように設計されています。
さらに、応答値がすべて0と1の場合、診断プロットは常に次のようになります。残差と適合を比較します。残余は次のように定義されます。$Y_i - \hat Y_i$、したがって、このプロットのすべての点は座標を持ちます $(\hat Y_i, \; 0-\hat Y_i)$ いつ $Y_i=0$、および $(\hat Y_i, \;1 - \hat Y_i)$ いつ $Y_i = 1$。したがって、これらの点はすべて、傾斜のある2本の線に沿って配置されます。$-1$ と傍受 $0$ そして $1$、それぞれ。この特定のプロットでは、いくつかの追加の標準化があり、シフトと曲率を引き起こしますが、それは0と1に対応する2つの異なる曲線を表示することを妨げません。
心配しないでください。