आर - पॉइसन रिग्रेशन

पॉइसन रिग्रेशन में प्रतिगमन मॉडल शामिल होते हैं जिसमें प्रतिक्रिया चर गिनती के रूप में होती है न कि भिन्नात्मक संख्याओं में। उदाहरण के लिए, एक फुटबॉल मैच श्रृंखला में जन्मों की संख्या या जीत की संख्या। इसके अलावा प्रतिक्रिया चर के मान एक पॉइसन वितरण का पालन करते हैं।

पॉसन प्रतिगमन के लिए सामान्य गणितीय समीकरण है -

log(y) = a + b1x1 + b2x2 + bnxn.....

निम्नलिखित मापदंडों का वर्णन है -

  • y प्रतिक्रिया चर है।

  • a तथा b संख्यात्मक गुणांक हैं।

  • x भविष्यवक्ता चर है।

Poisson प्रतिगमन मॉडल बनाने के लिए उपयोग किया जाने वाला कार्य है glm() समारोह।

वाक्य - विन्यास

के लिए मूल वाक्यविन्यास glm() पॉसों प्रतिगमन में कार्य है -

glm(formula,data,family)

उपरोक्त कार्यों में प्रयुक्त मापदंडों का विवरण निम्नलिखित है -

  • formula चरों के बीच के संबंध को प्रस्तुत करने वाला प्रतीक है।

  • data इन चरों का मान देने वाला डेटा सेट है।

  • familyमॉडल का विवरण निर्दिष्ट करने के लिए आर ऑब्जेक्ट है। लॉजिस्टिक रिग्रेशन के लिए यह 'पोइसन' है।

उदाहरण

हमारे पास इन-बिल्ड डेटा सेट "वॉरप्रेक्स" है जो प्रति लूम के वार ब्रेक्स की संख्या पर ऊन प्रकार (ए या बी) और तनाव (कम, मध्यम या उच्च) के प्रभाव का वर्णन करता है। चलो "ब्रेक" को प्रतिक्रिया चर के रूप में मानते हैं जो ब्रेक की संख्या की गिनती है। ऊन "प्रकार" और "तनाव" पूर्वसूचक चर के रूप में लिया जाता है।

Input Data

input <- warpbreaks
print(head(input))

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

breaks   wool  tension
1     26       A     L
2     30       A     L
3     54       A     L
4     25       A     L
5     70       A     L
6     52       A     L

प्रतिगमन मॉडल बनाएँ

output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
   family = poisson)
print(summary(output))

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)

Deviance Residuals: 
    Min       1Q     Median       3Q      Max  
  -3.6871  -1.6503  -0.4269     1.1902   4.2616  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.69196    0.04541  81.302  < 2e-16 ***
woolB       -0.20599    0.05157  -3.994 6.49e-05 ***
tensionM    -0.32132    0.06027  -5.332 9.73e-08 ***
tensionH    -0.51849    0.06396  -8.107 5.21e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 297.37  on 53  degrees of freedom
Residual deviance: 210.39  on 50  degrees of freedom
AIC: 493.06

Number of Fisher Scoring iterations: 4

सारांश में, हम प्रतिक्रिया चर पर पूर्ववर्ती चर के प्रभाव पर विचार करने के लिए अंतिम कॉलम में पी-मान 0.05 से कम होने के लिए देखते हैं। जैसा कि वुल्टाइप बी में तनाव के प्रकार एम और एच को देखा गया है, जो ब्रेक की गिनती पर प्रभाव डालते हैं।