आर - पॉइसन रिग्रेशन
पॉइसन रिग्रेशन में प्रतिगमन मॉडल शामिल होते हैं जिसमें प्रतिक्रिया चर गिनती के रूप में होती है न कि भिन्नात्मक संख्याओं में। उदाहरण के लिए, एक फुटबॉल मैच श्रृंखला में जन्मों की संख्या या जीत की संख्या। इसके अलावा प्रतिक्रिया चर के मान एक पॉइसन वितरण का पालन करते हैं।
पॉसन प्रतिगमन के लिए सामान्य गणितीय समीकरण है -
log(y) = a + b1x1 + b2x2 + bnxn.....
निम्नलिखित मापदंडों का वर्णन है -
y प्रतिक्रिया चर है।
a तथा b संख्यात्मक गुणांक हैं।
x भविष्यवक्ता चर है।
Poisson प्रतिगमन मॉडल बनाने के लिए उपयोग किया जाने वाला कार्य है glm() समारोह।
वाक्य - विन्यास
के लिए मूल वाक्यविन्यास glm() पॉसों प्रतिगमन में कार्य है -
glm(formula,data,family)
उपरोक्त कार्यों में प्रयुक्त मापदंडों का विवरण निम्नलिखित है -
formula चरों के बीच के संबंध को प्रस्तुत करने वाला प्रतीक है।
data इन चरों का मान देने वाला डेटा सेट है।
familyमॉडल का विवरण निर्दिष्ट करने के लिए आर ऑब्जेक्ट है। लॉजिस्टिक रिग्रेशन के लिए यह 'पोइसन' है।
उदाहरण
हमारे पास इन-बिल्ड डेटा सेट "वॉरप्रेक्स" है जो प्रति लूम के वार ब्रेक्स की संख्या पर ऊन प्रकार (ए या बी) और तनाव (कम, मध्यम या उच्च) के प्रभाव का वर्णन करता है। चलो "ब्रेक" को प्रतिक्रिया चर के रूप में मानते हैं जो ब्रेक की संख्या की गिनती है। ऊन "प्रकार" और "तनाव" पूर्वसूचक चर के रूप में लिया जाता है।
Input Data
input <- warpbreaks
print(head(input))
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
breaks wool tension
1 26 A L
2 30 A L
3 54 A L
4 25 A L
5 70 A L
6 52 A L
प्रतिगमन मॉडल बनाएँ
output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
family = poisson)
print(summary(output))
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.6871 -1.6503 -0.4269 1.1902 4.2616
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.69196 0.04541 81.302 < 2e-16 ***
woolB -0.20599 0.05157 -3.994 6.49e-05 ***
tensionM -0.32132 0.06027 -5.332 9.73e-08 ***
tensionH -0.51849 0.06396 -8.107 5.21e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 297.37 on 53 degrees of freedom
Residual deviance: 210.39 on 50 degrees of freedom
AIC: 493.06
Number of Fisher Scoring iterations: 4
सारांश में, हम प्रतिक्रिया चर पर पूर्ववर्ती चर के प्रभाव पर विचार करने के लिए अंतिम कॉलम में पी-मान 0.05 से कम होने के लिए देखते हैं। जैसा कि वुल्टाइप बी में तनाव के प्रकार एम और एच को देखा गया है, जो ब्रेक की गिनती पर प्रभाव डालते हैं।