R - Poisson Regresyonu
Poisson Regresyon, yanıt değişkeninin kesirli sayılar değil sayılar biçiminde olduğu regresyon modellerini içerir. Örneğin, bir futbol maçı serisindeki doğum sayısı veya galibiyet sayısı. Ayrıca yanıt değişkenlerinin değerleri bir Poisson dağılımını izler.
Poisson regresyonunun genel matematiksel denklemi -
log(y) = a + b1x1 + b2x2 + bnxn.....
Kullanılan parametrelerin açıklaması aşağıdadır -
y yanıt değişkendir.
a ve b sayısal katsayılardır.
x yordayıcı değişkendir.
Poisson regresyon modelini oluşturmak için kullanılan işlev, glm() işlevi.
Sözdizimi
İçin temel sözdizimi glm() Poisson regresyonunda fonksiyon -
glm(formula,data,family)
Yukarıdaki işlevlerde kullanılan parametrelerin açıklaması aşağıdadır -
formula değişkenler arasındaki ilişkiyi gösteren semboldür.
data bu değişkenlerin değerlerini veren veri setidir.
familymodelin ayrıntılarını belirtmek için R nesnesidir. Lojistik Regresyon için değeri 'Poisson'dur.
Misal
Yün tipi (A veya B) ve gerilimin (düşük, orta veya yüksek) dokuma tezgahı başına çözgü kopuşu sayısı üzerindeki etkisini tanımlayan dahili veri seti "çözgü kırılmaları" na sahibiz. Molaları bir sayı olan yanıt değişkeni olarak ele alalım. Yünün "tipi" ve "gerilimi" yordayıcı değişkenler olarak alınır.
Input Data
input <- warpbreaks
print(head(input))
Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -
breaks wool tension
1 26 A L
2 30 A L
3 54 A L
4 25 A L
5 70 A L
6 52 A L
Regresyon Modeli Oluşturun
output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
family = poisson)
print(summary(output))
Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -
Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.6871 -1.6503 -0.4269 1.1902 4.2616
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.69196 0.04541 81.302 < 2e-16 ***
woolB -0.20599 0.05157 -3.994 6.49e-05 ***
tensionM -0.32132 0.06027 -5.332 9.73e-08 ***
tensionH -0.51849 0.06396 -8.107 5.21e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 297.37 on 53 degrees of freedom
Residual deviance: 210.39 on 50 degrees of freedom
AIC: 493.06
Number of Fisher Scoring iterations: 4
Özet olarak, tahmin değişkeninin yanıt değişkeni üzerindeki etkisini göz önünde bulundurmak için son sütundaki p değerinin 0,05'ten küçük olmasını arıyoruz. Görüldüğü gibi, M ve H gerilim tipine sahip yün tipi B'nin kırılma sayısı üzerinde etkisi vardır.