सांख्यिकी - अवशिष्ट विश्लेषण
अवशिष्ट विश्लेषण का उपयोग अवशिष्ट को परिभाषित करके और अवशिष्ट अवगुणों की जांच करके एक रेखीय प्रतिगमन मॉडल की उपयुक्तता का आकलन करने के लिए किया जाता है।
अवशिष्ट
अवशिष्ट ($ e $) प्रेक्षित मान ($ y $) बनाम अनुमानित मूल्य ($ \ hat y $) के बीच के अंतर को संदर्भित करता है। प्रत्येक डेटा बिंदु में एक अवशिष्ट होता है।
$ {अवशिष्ट = अवलोकित किया गया - पूर्वानुमानित \ _ [7 सप्त] ई = य - \ हत् य = 2
अवशिष्ट प्लॉट
एक अवशिष्ट भूखंड एक ग्राफ है जिसमें अवशिष्ट tthe ऊर्ध्वाधर अक्ष पर होते हैं और स्वतंत्र चर क्षैतिज अक्ष पर होता है। यदि डॉट्स क्षैतिज अक्ष के चारों ओर बेतरतीब ढंग से बिखरे हुए हैं, तो एक रेखीय प्रतिगमन मॉडल डेटा के लिए उपयुक्त है; अन्यथा, एक गैर-रेखीय मॉडल चुनें।
अवशिष्ट प्लॉट के प्रकार
निम्नलिखित उदाहरण अवशिष्ट भूखंडों में कुछ पैटर्न दिखाते हैं।
पहले मामले में, डॉट्स को बेतरतीब ढंग से फैलाया जाता है। इसलिए रैखिक प्रतिगमन मॉडल को प्राथमिकता दी जाती है। दूसरे और तीसरे मामले में, डॉट्स गैर-यादृच्छिक रूप से छितरी हुई हैं और बताती हैं कि एक गैर-रेखीय प्रतिगमन विधि पसंद की जाती है।
उदाहरण
Problem Statement:
जांचें कि निम्नलिखित डेटा के लिए एक रैखिक प्रतिगमन मॉडल कहां उपयुक्त है।
$ x $ | 60 | 70 | 80 | 85 | 95 |
---|---|---|---|---|---|
$ y $ (वास्तविक मूल्य) | 70 | 65 | 70 | 95 | 85 |
$ \ hat y $ (अनुमानित मूल्य) | 65.411 | 71.849 | 78.288 | 81.507 | 87.945 |
Solution:
Step 1: प्रत्येक डेटा बिंदु के लिए अवशिष्टों की गणना करें।
$ x $ | 60 | 70 | 80 | 85 | 95 |
---|---|---|---|---|---|
$ y $ (वास्तविक मूल्य) | 70 | 65 | 70 | 95 | 85 |
$ \ hat y $ (अनुमानित मूल्य) | 65.411 | 71.849 | 78.288 | 81.507 | 87.945 |
$ ई $ (अवशिष्ट) | 4.589 | -6.849 | -8.288 | 13.493 | -2.945 |
Step 2: - अवशिष्ट प्लॉट ग्राफ को ड्रा करें।
Step 3: - अवशिष्टों की यादृच्छिकता की जाँच करें।
यहाँ अवशिष्ट भूखंड एक यादृच्छिक पैटर्न निकालता है - पहला अवशिष्ट धनात्मक है, दो निम्न ऋणात्मक हैं, चौथा एक धनात्मक है, और अंतिम अवशिष्ट ऋणात्मक है। जैसा कि पैटर्न काफी यादृच्छिक है जो इंगित करता है कि उपरोक्त डेटा के लिए एक रेखीय प्रतिगमन मॉडल उपयुक्त है।