सांख्यिकी - डेटा पैटर्न

जब वे रेखांकन के साथ खींचे जाते हैं तो डेटा पैटर्न बहुत उपयोगी होते हैं। आमतौर पर केंद्र, प्रसार, आकार और अन्य असामान्य गुणों जैसी सुविधाओं के संदर्भ में डेटा पैटर्न का वर्णन किया गया है। अन्य विशेष वर्णनात्मक लेबल सममित, घंटी के आकार का, तिरछा आदि हैं।

केन्द्र

वितरण का केंद्र, रेखीय रूप से, वितरण के मध्य में स्थित होता है। ऐसा ग्राफिक चार्ट दिखाता है कि लगभग आधे अवलोकन दोनों तरफ हैं। प्रत्येक स्तंभ की ऊँचाई अवलोकनों की आवृत्ति को इंगित करती है।

फैलाव

वितरण का प्रसार डेटा की भिन्नता को दर्शाता है। यदि अवलोकन का सेट एक विस्तृत श्रृंखला को कवर करता है, तो प्रसार बड़ा होता है। यदि अवलोकन एक मूल्य के आसपास केंद्रित हैं, तो प्रसार छोटा है।

आकार

निम्नलिखित विशेषताओं का उपयोग करके वितरण का आकार वर्णित किया जा सकता है।

  • Symmetry - सममित वितरण में, ग्राफ को केंद्र में इस तरह से विभाजित किया जा सकता है कि प्रत्येक आधा दूसरे की दर्पण छवि हो।

  • Number of peaks.- एक या कई चोटियों के साथ वितरण। एक स्पष्ट शिखर के साथ वितरण को अनिमॉडल के रूप में जाना जाता है, और दो स्पष्ट चोटियों के साथ वितरण को बिमोडल कहा जाता है। केंद्र में एक एकल चोटी सममित वितरण, को घंटी के आकार का कहा जाता है।

  • Skewness- कुछ डिस्ट्रीब्यूशन में ग्राफ के एक तरफ दूसरी तरफ से कई ऑब्जर्वेशन हो सकते हैं। कम मूल्यों के प्रति कम टिप्पणियों वाले वितरण को सही तिरछा कहा जाता है; और कम मूल्यों के प्रति कम टिप्पणियों के साथ वितरण को तिरछा छोड़ दिया जाता है।

  • Uniform - जब अवलोकनों के सेट में कोई शिखर नहीं होता है और वितरण की सीमा में समान रूप से फैला हुआ डेटा होता है, तो वितरण को एक समान वितरण कहा जाता है।

असामान्य विशेषताएं

डेटा पैटर्न की सामान्य असामान्य विशेषताएं अंतराल और आउटलेयर हैं।

  • Gaps- अंतराल एक वितरण के क्षेत्रों को इंगित करता है जिसमें कोई अवलोकन नहीं है। निम्नलिखित आंकड़ों में अंतर है क्योंकि वितरण के बीच में कोई अवलोकन नहीं है।

  • Outliers- वितरण चरम मूल्यों की विशेषता हो सकती है जो अवलोकन डेटा के दूसरे सेट से बहुत भिन्न होते हैं। इन चरम मूल्यों को आउटलेर के रूप में संदर्भित किया जाता है। निम्नलिखित आंकड़ा एक बाहरी के साथ एक वितरण दिखाता है।