कैसे कर सकते हैं $t$-परिवर्तन का प्रयोग परिकल्पना का परीक्षण करने के लिए किया जाता है?

Aug 15 2020

मेरे पास निम्नलिखित प्रश्न हैं: सामान्य वितरण से आकार 25 का एक यादृच्छिक नमूना 47 का मतलब है और मानक विचलन 7. आधारित है $t$-स्टेटिस्टिक्स, क्या हम कह सकते हैं कि दी गई जानकारी अनुमान का समर्थन करती है कि जनसंख्या का मतलब 42 है?

मैं वास्तव में उलझन में हूँ कि कैसे $t$-परिवर्तन एक परिकल्पना को अस्वीकार करने या विफल करने के लिए काम करता है। एक स्पष्टीकरण वास्तव में उपयोगी होगा। धन्यवाद!

जवाब

2 BruceET Aug 16 2020 at 01:35

दो-पक्षीय एक-नमूना टी-टेस्ट

बस एक सामान्य डेटासेट के साथ हुआ $n=25, \bar X = 57, S = 7$ मेरे R सत्र विंडो में।

क्या परीक्षण के लिए डेटा उपयुक्त हैं? यहाँ R द्वारा गणना की गई डेटा का सारांश है:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

लगभग कोई भी बाहरी लोगों के साथ लगभग सममित डेटा नहीं; उपरोक्त पी-मान के साथ शापिरो-विल्क सामान्यता परीक्षा पास करता है$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

परीक्षण मान्य होने के लिए डेटा सामान्य से काफी करीब है।

टी परीक्षण के लिए प्रिंटआउट। इस प्रकार, यहाँ एक से एक नमूना टी परीक्षण के लिए आर से आउटपुट है$H_0: \mu = 42$ विरुद्ध $H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47 

आउटपुट की व्याख्या। P- मान है$0.0015 < 0.05 = 5\%,$ तो आप अस्वीकार करेंगे $H_0$महत्व के 5% स्तर पर। आप 1% के स्तर पर भी अस्वीकार कर सकते हैं।

आउटपुट 95% विश्वास अंतराल (CI) भी देता है $(44.11, 49.89),$ इसलिए हम इसका सही मूल्य निकाल सकते हैं $\mu$उस अंतराल में है - जिसमें शामिल नहीं है$\mu = 42.$

इस CI की एक व्याख्या यह है कि यह "गैर-अस्वीकार्य" अशक्त परिकल्पनाओं का एक अंतराल है, जो आपके डेटा पर आधारित है।

विवरण आपके परीक्षण के बारे में जानना चाहिए। @PeterForeman ने आपको दिखाया है कि टी-स्टेटिस्टिक की गणना कैसे करें। पी-वैल्यू को छोड़कर, आपको आउटपुट में बाकी सभी चीजों को हाथ से गणना करने में सक्षम होना चाहिए।

  • कंप्यूटर प्रिंटआउट में सटीक P- मान दिए गए हैं। टी की एक मुद्रित तालिका को देखकर , आपको पी-मूल्य को 'कोष्ठक' करने में सक्षम होना चाहिए। उदाहरण के लिए, मेरी तालिका में डीएफ = 24 पर 2.467 और 3.745 का मान है, जो टी-स्टेटिस्टिक 3.5714 को ब्रैकेट करता है। मेरी तालिका के शीर्ष मार्जिन को देखते हुए, मैं देखता हूं कि पी-मूल्य के बीच होना चाहिए$2(0.001) = 0.002$ तथा $2(0.0005) = 0.001,$जो R से मान से सहमत है [ 2s हैं क्योंकि यह एक 2-पक्षीय टी परीक्षण है।]

  • आप इस 2-पक्षीय परीक्षण का सटीक पी-मूल्य आर या अन्य सांख्यिकीय सॉफ़्टवेयर में प्राप्त कर सकते हैं। यह एक टी सांख्यिकीय दूर से की संभावना है$0$ मनाया गया $T =3.5714.$आर में, जहां ptछात्र के वितरण का एक सीडीएफ है, निम्नलिखित गणना आपको प्रिंटआउट में पी-मान के बहुत करीब पहुंचती है। (यदि रिपोर्ट किए गए T स्टेटिस्टिक का मान गोल है, तो P-value वास्तव में मेल नहीं खा सकता है, लेकिन निर्णय लेने के लिए दशमलव स्थानों का केवल पहला भाग मायने रखता है।)

2 * (1 - pt(3.5714, 24))
[1] 0.001543522
  • टिप्पणियों में आपके एक प्रश्न का उत्तर देने के लिए: मुद्रित टी टेबल से, आप कह सकते हैं कि 5% के स्तर पर अस्वीकार करने का एक महत्वपूर्ण मूल्य है$c = 2.064.$ यही कारण है कि आप 5% के स्तर पर अस्वीकार कर देंगे $|T| > 2.064,$जो यह है। महत्वपूर्ण मूल्य संभावना को काट देता है$0.025 = 2.5\% $DF = 24 के साथ छात्र के वितरण की ऊपरी पूंछ से। आर में, जहां qtएक मात्रात्मक फ़ंक्शन (उलटा सीडीएफ) है, आप नीचे दिखाए गए अनुसार 5% महत्वपूर्ण मान प्राप्त कर सकते हैं। महत्व के 1% के स्तर पर परीक्षण के लिए महत्वपूर्ण मूल्य क्या है?

${}$

qt(.975, 24)
[1] 2.063899

आलेखीय सारांश। नीचे दिया गया आंकड़ा 24 DF के साथ छात्र के वितरण के घनत्व को दर्शाता है। जैसा ऊर्ध्वाधर नीला टी-आँकड़ा का मनाया मूल्य दर्शाता है। पी-मान इस रेखा के दाईं ओर वक्र के नीचे का क्षेत्र है। 5% स्तर पर परीक्षण के लिए निचले और ऊपरी महत्वपूर्ण मान ऊर्ध्वाधर बिंदीदार नारंगी लाइनों द्वारा दिखाए जाते हैं; 1% के स्तर पर एक परीक्षण के लिए लाल रेखाएँ (दूर)।