डेटा के नमूने के साथ एक उदाहरण की तुलना कैसे करें?
मुझे लगता है कि $t$-आम तौर पर उदाहरण के लिए जाँच करने के लिए उपयोग किया जाता है कि क्या कोई नमूना आबादी का है, या यदि दो नमूने अलग हैं।
अगर आप का एक नमूना है तो क्या होगा $n=200$और आप जांचना चाहते हैं कि नया व्यक्तिगत उदाहरण क्या संभावना है, उस नमूने का हिस्सा है। या बल्कि मैं सिर्फ यह जानना चाहता हूं कि नमूने के वितरण में उदाहरण कहां है!
जवाब
यह प्रश्न @ StatsStudent के लिंक के समान है, जिसे आपको पढ़ना चाहिए। हालांकि, एक प्रमुख और महत्वपूर्ण, अंतर यह है कि आपकी तुलना का नमूना बहुत बड़ा है$n = 200.$
मान लीजिए कि आपकी सामान्य आबादी है $\mathsf{Norm}(\mu=100, \sigma=15)$ और एक अतिरिक्त अवलोकन $X = 130.$आप पूछ सकते हैं कि यह संभव है कि नया अवलोकन उस आबादी से आया हो। एक पारंपरिक जवाब, वह है$P(X \ge 130) = P(Z > (130-100)/15 = 2)\approx 0.023.$ इसलिए यदि आप इसे पी-मान के रूप में व्याख्या करते हैं तो आप कहेंगे, शायद नहीं (यदि आपको 5% के स्तर पर परीक्षण पसंद है)।
1 - pnorm(130, 100, 15)
[1] 0.02275013
1 - pnorm(2) # std normal w/o extra parameters
[1] 0.02275013
अब मान लीजिए कि आपके पास आकार का एक नमूना है $n = 200.$ आपके लिए यह अज्ञात है $\mathsf{Norm}(\mu=100, \sigma=15).$आप मान सकते हैं कि आपका नया अवलोकन 200 के अपने नमूने के समान जनसंख्या वाले जनसंख्या से है। तब आप एक पूल किए गए 2-नमूना टी परीक्षण कर सकते हैं, और आप यह निष्कर्ष निकाल सकते हैं कि नया अवलोकन समान जनसंख्या आ सकता है क्योंकि पी-मूल्य 0.078 है (यदि आप 5% के स्तर पर परीक्षण पसंद करते हैं)।
set.seed(2020)
x2 = rnorm(200, 100, 15)
t.test(130, x2, var.eq = T)
Two Sample t-test
data: 130 and x2
t = 1.7697, df = 199, p-value = 0.0783
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.433716 63.535081
sample estimates:
mean of x mean of y
130.00000 99.94932
कुछ इसी तरह के संदर्भ समूहों के आधे से अधिक अस्वीकृति के लिए नेतृत्व करेंगे:
set.seed(2020)
x = 130
pv = replicate(10^5, t.test(x, rnorm(200,100,15), var.eq=T)$p.val)
mean(pv <= 0.05)
[1] 0.58711