आर - एकाधिक प्रतिगमन
एकाधिक प्रतिगमन दो से अधिक चर के बीच संबंध में रैखिक प्रतिगमन का विस्तार है। सरल रैखिक संबंध में हमारे पास एक प्रेडिक्टर और एक रिस्पांस वेरिएबल होता है, लेकिन कई रिग्रेशन में हमारे पास एक से अधिक प्रेडिक्टर वैरिएबल और एक रिस्पॉन्स वेरिएबल होता है।
एकाधिक प्रतिगमन के लिए सामान्य गणितीय समीकरण है -
y = a + b1x1 + b2x2 +...bnxn
निम्नलिखित मापदंडों का वर्णन है -
y प्रतिक्रिया चर है।
a, b1, b2...bn गुणांक हैं।
x1, x2, ...xn भविष्यवक्ता चर हैं।
हम प्रतिगमन मॉडल का उपयोग करके बनाते हैं lm()R में कार्य करता है। मॉडल इनपुट डेटा का उपयोग करके गुणांक के मूल्य को निर्धारित करता है। आगे हम इन गुणांक का उपयोग करके भविष्यवक्ता चर के दिए गए सेट के लिए प्रतिक्रिया चर के मूल्य का अनुमान लगा सकते हैं।
lm () फ़ंक्शन
यह फ़ंक्शन भविष्यवक्ता और प्रतिक्रिया चर के बीच संबंध मॉडल बनाता है।
वाक्य - विन्यास
के लिए मूल वाक्यविन्यास lm() कई प्रतिगमन में कार्य है -
lm(y ~ x1+x2+x3...,data)
निम्नलिखित मापदंडों का वर्णन है -
formula प्रतिक्रिया चर और भविष्य कहनेवाला चर के बीच के संबंध को प्रस्तुत करने वाला एक प्रतीक है।
data वह वेक्टर है जिस पर सूत्र लागू किया जाएगा।
उदाहरण
इनपुट डेटा
R वातावरण में उपलब्ध डेटा सेट "mtcars" पर विचार करें। यह प्रति गैलन (mpg), सिलेंडर विस्थापन ("विवाद"), घोड़े की शक्ति ("एचपी"), कार के वजन ("wt") और कुछ और मापदंडों के अनुसार विभिन्न कार मॉडल के बीच तुलना देता है।
मॉडल का लक्ष्य "mpg" के बीच संबंध को "डिफरेंस", "hp" और "wt" के साथ प्रेडिक्टर वैरिएबल के रूप में स्थापित करना है। हम इस उद्देश्य के लिए सेट किए गए mtcars डेटा से इन चर का एक सबसेट बनाते हैं।
input <- mtcars[,c("mpg","disp","hp","wt")]
print(head(input))
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
mpg disp hp wt
Mazda RX4 21.0 160 110 2.620
Mazda RX4 Wag 21.0 160 110 2.875
Datsun 710 22.8 108 93 2.320
Hornet 4 Drive 21.4 258 110 3.215
Hornet Sportabout 18.7 360 175 3.440
Valiant 18.1 225 105 3.460
संबंध मॉडल बनाएं और गुणांक प्राप्त करें
input <- mtcars[,c("mpg","disp","hp","wt")]
# Create the relationship model.
model <- lm(mpg~disp+hp+wt, data = input)
# Show the model.
print(model)
# Get the Intercept and coefficients as vector elements.
cat("# # # # The Coefficient Values # # # ","\n")
a <- coef(model)[1]
print(a)
Xdisp <- coef(model)[2]
Xhp <- coef(model)[3]
Xwt <- coef(model)[4]
print(Xdisp)
print(Xhp)
print(Xwt)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
Call:
lm(formula = mpg ~ disp + hp + wt, data = input)
Coefficients:
(Intercept) disp hp wt
37.105505 -0.000937 -0.031157 -3.800891
# # # # The Coefficient Values # # #
(Intercept)
37.10551
disp
-0.0009370091
hp
-0.03115655
wt
-3.800891
प्रतिगमन मॉडल के लिए समीकरण बनाएँ
उपरोक्त अवरोधन और गुणांक मूल्यों के आधार पर, हम गणितीय समीकरण बनाते हैं।
Y = a+Xdisp.x1+Xhp.x2+Xwt.x3
or
Y = 37.15+(-0.000937)*x1+(-0.0311)*x2+(-3.8008)*x3
नए मूल्यों की भविष्यवाणी के लिए समीकरण लागू करें
हम माइलेज की भविष्यवाणी करने के लिए ऊपर बनाए गए रिग्रेशन समीकरण का उपयोग कर सकते हैं जब विस्थापन, घोड़े की शक्ति और वजन के लिए मूल्यों का एक नया सेट प्रदान किया जाता है।
विवाद वाली कार के लिए = 221, hp = 102 और wt = 2.91 अनुमानित माइलेज है -
Y = 37.15+(-0.000937)*221+(-0.0311)*102+(-3.8008)*2.91 = 22.7104