सांख्यिकी - फिट की अच्छाई

Goodness of Fitपरीक्षण का उपयोग नमूना डेटा की जांच करने के लिए किया जाता है कि यह आबादी के वितरण से फिट बैठता है या नहीं। जनसंख्या का सामान्य वितरण या वेइबुल वितरण हो सकता है। सरल शब्दों में, यह दर्शाता है कि नमूना डेटा सही ढंग से उस डेटा का प्रतिनिधित्व करता है जिसकी हम वास्तविक आबादी से उम्मीद कर रहे हैं। निम्नलिखित परीक्षण आमतौर पर सांख्यिकीविदों द्वारा उपयोग किए जाते हैं:

  • Chi-square

  • Kolmogorov-Smirnov

  • Anderson-Darling

  • Shipiro-Wilk

ची - वर्ग परीक्षण

ची-स्क्वायर परीक्षण का उपयोग आमतौर पर फिट परीक्षणों की अच्छाई का परीक्षण करने के लिए किया जाता है और इसका उपयोग द्विपद वितरण और पॉइसन वितरण जैसे असतत वितरण के लिए किया जाता है, जबकि कोलमोगोरोव-स्मिरनोव और एंडरसन-डार्लिंग फिटमेंट की अच्छाई का उपयोग निरंतर वितरण के लिए किया जाता है। ।

सूत्र

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]}} $

कहाँ -

  • $ {O_i} $ = चर के i वें स्तर का मनाया गया मान।

  • $ {E_i} $ = वेरिएबल के i वें स्तर का अपेक्षित मूल्य।

  • $ {X ^ 2} $ = ची-चुकता यादृच्छिक चर।

उदाहरण

एक खिलौना कंपनी फुटबॉल खिलाड़ी खिलौने बनाती है। यह दावा करता है कि 30% कार्ड मिड फील्डर, 60% डिफेंडर और 10% फॉरवर्ड हैं। 100 खिलौनों के यादृच्छिक नमूने को ध्यान में रखते हुए 50 मिड-फील्डर, 45 डिफेंडर और 5 फॉरवर्ड हैं। 0.05 के स्तर को देखते हुए, क्या आप कंपनी के दावे को सही ठहरा सकते हैं?

Solution:

परिकल्पनाएँ निर्धारित करें

  • Null hypothesis $ H_0 $ - मिड-फील्डर, डिफेंडर और फॉरवर्ड का अनुपात क्रमशः 30%, 60% और 10% है।

  • Alternative hypothesis $ H_1 $ - शून्य परिकल्पना में कम से कम एक अनुपात गलत है।

स्वतंत्रता की डिग्री निर्धारित करें

स्वतंत्रता की डिग्री, DF, श्रेणीगत चर माइनस 1 के स्तरों (k) के बराबर है: DF = k - 1. यहाँ स्तर 3. हैं।

$ {DF = k - 1 \\ [7pt] \, = 3 -1 = 2} $

ची-स्क्वायर टेस्ट स्टेटिस्टिक निर्धारित करें

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}} + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13.33 + 3.75 + 2.50 \\ [7pt] \, = 19.58} $

P- मान निर्धारित करें

पी-मूल्य की संभावना है कि एक ची-स्क्वायर आँकड़ा, $ X ^ 2 $ 2 की स्वतंत्रता के 2 डिग्री 5.58 से अधिक चरम है। $ {P (X ^ 2 \ gt 19.58) = 0.0001} $ खोजने के लिए ची-स्क्वायर वितरण कैलकुलेटर का उपयोग करें।

परिणाम की व्याख्या करें

जैसा कि पी-मान (0.0001) महत्व स्तर (0.05) से काफी कम है, शून्य परिकल्पना को स्वीकार नहीं किया जा सकता है। इस प्रकार कंपनी का दावा अमान्य है।