डेटा के नमूने के साथ एक उदाहरण की तुलना कैसे करें?

Aug 17 2020

मुझे लगता है कि $t$-आम तौर पर उदाहरण के लिए जाँच करने के लिए उपयोग किया जाता है कि क्या कोई नमूना आबादी का है, या यदि दो नमूने अलग हैं।

अगर आप का एक नमूना है तो क्या होगा $n=200$और आप जांचना चाहते हैं कि नया व्यक्तिगत उदाहरण क्या संभावना है, उस नमूने का हिस्सा है। या बल्कि मैं सिर्फ यह जानना चाहता हूं कि नमूने के वितरण में उदाहरण कहां है!

जवाब

3 BruceET Aug 17 2020 at 21:06

यह प्रश्न @ StatsStudent के लिंक के समान है, जिसे आपको पढ़ना चाहिए। हालांकि, एक प्रमुख और महत्वपूर्ण, अंतर यह है कि आपकी तुलना का नमूना बहुत बड़ा है$n = 200.$

मान लीजिए कि आपकी सामान्य आबादी है $\mathsf{Norm}(\mu=100, \sigma=15)$ और एक अतिरिक्त अवलोकन $X = 130.$आप पूछ सकते हैं कि यह संभव है कि नया अवलोकन उस आबादी से आया हो। एक पारंपरिक जवाब, वह है$P(X \ge 130) = P(Z > (130-100)/15 = 2)\approx 0.023.$ इसलिए यदि आप इसे पी-मान के रूप में व्याख्या करते हैं तो आप कहेंगे, शायद नहीं (यदि आपको 5% के स्तर पर परीक्षण पसंद है)।

1 - pnorm(130, 100, 15)
[1] 0.02275013

1 - pnorm(2)            # std normal w/o extra parameters
[1] 0.02275013

अब मान लीजिए कि आपके पास आकार का एक नमूना है $n = 200.$ आपके लिए यह अज्ञात है $\mathsf{Norm}(\mu=100, \sigma=15).$आप मान सकते हैं कि आपका नया अवलोकन 200 के अपने नमूने के समान जनसंख्या वाले जनसंख्या से है। तब आप एक पूल किए गए 2-नमूना टी परीक्षण कर सकते हैं, और आप यह निष्कर्ष निकाल सकते हैं कि नया अवलोकन समान जनसंख्या आ सकता है क्योंकि पी-मूल्य 0.078 है (यदि आप 5% के स्तर पर परीक्षण पसंद करते हैं)।

set.seed(2020)
x2 = rnorm(200, 100, 15)
t.test(130, x2, var.eq = T)

        Two Sample t-test

data:  130 and x2
t = 1.7697, df = 199, p-value = 0.0783
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -3.433716 63.535081
sample estimates:
mean of x mean of y 
130.00000  99.94932 

कुछ इसी तरह के संदर्भ समूहों के आधे से अधिक अस्वीकृति के लिए नेतृत्व करेंगे:

set.seed(2020)
x = 130
pv = replicate(10^5, t.test(x, rnorm(200,100,15), var.eq=T)$p.val)
mean(pv <= 0.05)
[1] 0.58711