R - Poisson Regresyonu

Poisson Regresyon, yanıt değişkeninin kesirli sayılar değil sayılar biçiminde olduğu regresyon modellerini içerir. Örneğin, bir futbol maçı serisindeki doğum sayısı veya galibiyet sayısı. Ayrıca yanıt değişkenlerinin değerleri bir Poisson dağılımını izler.

Poisson regresyonunun genel matematiksel denklemi -

log(y) = a + b1x1 + b2x2 + bnxn.....

Kullanılan parametrelerin açıklaması aşağıdadır -

  • y yanıt değişkendir.

  • a ve b sayısal katsayılardır.

  • x yordayıcı değişkendir.

Poisson regresyon modelini oluşturmak için kullanılan işlev, glm() işlevi.

Sözdizimi

İçin temel sözdizimi glm() Poisson regresyonunda fonksiyon -

glm(formula,data,family)

Yukarıdaki işlevlerde kullanılan parametrelerin açıklaması aşağıdadır -

  • formula değişkenler arasındaki ilişkiyi gösteren semboldür.

  • data bu değişkenlerin değerlerini veren veri setidir.

  • familymodelin ayrıntılarını belirtmek için R nesnesidir. Lojistik Regresyon için değeri 'Poisson'dur.

Misal

Yün tipi (A veya B) ve gerilimin (düşük, orta veya yüksek) dokuma tezgahı başına çözgü kopuşu sayısı üzerindeki etkisini tanımlayan dahili veri seti "çözgü kırılmaları" na sahibiz. Molaları bir sayı olan yanıt değişkeni olarak ele alalım. Yünün "tipi" ve "gerilimi" yordayıcı değişkenler olarak alınır.

Input Data

input <- warpbreaks
print(head(input))

Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -

breaks   wool  tension
1     26       A     L
2     30       A     L
3     54       A     L
4     25       A     L
5     70       A     L
6     52       A     L

Regresyon Modeli Oluşturun

output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
   family = poisson)
print(summary(output))

Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -

Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)

Deviance Residuals: 
    Min       1Q     Median       3Q      Max  
  -3.6871  -1.6503  -0.4269     1.1902   4.2616  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.69196    0.04541  81.302  < 2e-16 ***
woolB       -0.20599    0.05157  -3.994 6.49e-05 ***
tensionM    -0.32132    0.06027  -5.332 9.73e-08 ***
tensionH    -0.51849    0.06396  -8.107 5.21e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 297.37  on 53  degrees of freedom
Residual deviance: 210.39  on 50  degrees of freedom
AIC: 493.06

Number of Fisher Scoring iterations: 4

Özet olarak, tahmin değişkeninin yanıt değişkeni üzerindeki etkisini göz önünde bulundurmak için son sütundaki p değerinin 0,05'ten küçük olmasını arıyoruz. Görüldüğü gibi, M ve H gerilim tipine sahip yün tipi B'nin kırılma sayısı üzerinde etkisi vardır.