डेटा सेट में आउटलेर का पता लगाना
आउटलेर डेटा बिंदु हैं जो बाकी संख्याओं के पैटर्न के अनुरूप नहीं हैं। वे डेटा सेट में अत्यंत उच्च या अत्यंत निम्न मान हैं।
एक बाहरी तरीका खोजने के लिए एक सरल तरीका डेटा सेट में संख्याओं की जांच करना है। हम देखेंगे कि अधिकांश संख्याएँ एक सीमा के आसपास होती हैं और कुछ संख्याएँ बाकी संख्याओं की तुलना में बहुत कम या बहुत अधिक होती हैं। इस तरह की संख्या को आउटलेर के रूप में जाना जाता है।
Other definition of an outlier
एक डेटा बिंदु जो विशिष्ट रूप से बाकी डेटा से अलग होता है। बाह्यरेखा की एक परिभाषा किसी भी डेटा बिंदु की पहली चतुर्थक से नीचे या तीसरी चतुर्थक से ऊपर 1.5 इंटरक्विटाइल रेंज (IQRs) से अधिक है। इंटरक्वेर्टाइल रेंज (IQR) तीसरी चतुर्थक और डेटा सेट की पहली चतुर्थक के बीच का अंतर है।
डेटा 0, 2, 5, 6, 9, 12, 35 के लिए बाहरी (ओं) का पता लगाएं।
उपाय
दिए गए डेटा सेट के लिए, हमारे पास निम्नलिखित पांच नंबर का सारांश है।
न्यूनतम = 0
प्रथम चतुर्थांश = २
माध्य = ६
तीसरा चतुर्थक = 12
अधिकतम = 35
IQR = 12 - 2 = 10, इसलिए 1.5 · IQR = 15।
यह निर्धारित करने के लिए कि क्या आउटलेयर हैं, हमें उन नंबरों पर विचार करना चाहिए जो कि चतुर्थकों से परे 1.5 · IQR या 15 हैं।
पहली चतुर्थक - 1.5 · IQR = 2 - 15 = –13
तीसरा चतुर्थांश + 1.5 · IQR = 12 + 15 = 27
चूँकि 35 अंतराल -13 से 27 के अंतराल के बाहर है, इसलिए 35 इस डेटा सेट में बाहरी है।
नीचे दिए गए डेटा में outlier (ओं) का पता लगाएं।
28, 26, 29, 30, 81, 32, 37
उपाय
Step 1:
दिए गए सेट में अन्य संख्याओं से भिन्न डेटा 81 है
Step 2:
इसलिए इस डेटा सेट की रूपरेखा 81 है
नीचे दिए गए डेटा में outlier (ओं) का पता लगाएं।
16, 14, 3, 12, 15, 17, 22, 15, 52
उपाय
Step 1:
दिए गए सेट में अन्य संख्याओं से भिन्न डेटा 52 है
Step 2:
तो इस डेटा सेट की रूपरेखा 52 है