पियर्सन की ची के वर्ग की स्वतंत्रता के लिए नमूना आकार
मैं एक करने की कोशिश कर रहा हूँ $\chi^2$दो चर के बीच स्वतंत्रता का परीक्षण। मेरे पास समस्या यह है कि मैं परीक्षण के लिए नमूना आकार के साथ संघर्ष कर रहा हूं। मैं हमेशा कुछ कोशिकाओं के साथ समाप्त होता हूं जिनमें 0 नमूने होते हैं।
मेरे पास पूरी आबादी पर उपलब्ध डेटा है, लेकिन मैं इसे परिकल्पना परीक्षण के लिए उपयोग नहीं कर सकता हूं इसलिए मैं प्रतिस्थापन के साथ और बिना विभिन्न आकारों के साथ कोशिश कर रहा हूं। इसके अलावा, जनसंख्या काफी छोटी है - केवल 162।
छोटे नमूना आकारों के chisq()
साथ R में फ़ंक्शन त्रुटि संदेशों के साथ आता रहा है कि अनुमान गलत हो सकता है।
> chisq = chisq.test(tbl)
Warning message:
In chisq.test(tbl) : Chi-squared approximation may be incorrect
अब मैं प्रतिस्थापन के साथ 100% आबादी के नमूने के आकार तक गया हूं। त्रुटि गायब हो गई है, लेकिन मैं इससे चिंतित हूं:
क) मेरे पास अभी भी कुछ कोशिकाओं में 0 नमूने हैं :
var2_high var2_low var2_medium var2_very_high
var1_high 12 0 10 3
var1_low 10 20 9 1
var1_medium 5 23 19 0
var1_very_high 9 0 0 41
और बी) मुझे यकीन नहीं है कि अगर ऐसा नमूना आकार स्वीकार्य है ।
किसी को भी इन सवालों के साथ मेरी मदद कर सकते हैं?
जवाब
आप ऊपर संदेश देख रहे हैं क्योंकि नमूना आकार छोटा होने पर ची स्क्वैयर सन्निकटन अविश्वसनीय है। मेरा सुझाव है कि आप मूल डेटा का उपयोग करें और एक फिशर सटीक परीक्षण करें। एक उदाहरण नीचे दिया गया है जब यह समस्या उत्पन्न हो सकती है और हम पूर्वोक्त परीक्षण का उपयोग करके इसे कैसे संबोधित कर सकते हैं।
मान लीजिए हमारे पास निम्न नमूना डेटा है। एक तरफ के रूप में, महिला चखने चाय के प्रयोग से फिशर सटीक परीक्षण बनाया गया था ।
Truth
Guess Milk Tea
Milk 3 1
Tea 1 3
हम इस परिकल्पना का परीक्षण करना चाहते हैं कि दो चर स्वतंत्र हैं। चि स्क्वेर्ड टेस्ट का उपयोग करने से हमें नीचे चेतावनी मिलती है:
Code:
TeaTasting <- matrix(c(3, 1, 1, 3),
nrow = 2,
dimnames = list(Guess = c("Milk", "Tea"), Truth = c("Milk", "Tea")))
chiSqTest= chisq.test(TeaTasting)
Warning message:
In chisq.test(TeaTasting) : Chi-squared approximation may be incorrect
यह आश्चर्यजनक नहीं है क्योंकि नमूना आकार अपेक्षाकृत छोटा है। इसके अलावा, हम देखते हैं कि अपेक्षित गणना सभी 5 से कम हैं।
chiSqTest$expected
Truth
Guess Milk Tea
Milk 2 2
Tea 2 2
इस मामले में, हम अपनी परिकल्पना का परीक्षण करने के लिए फिशर सटीक परीक्षण का उपयोग कर सकते हैं।
fisher.test(TeaTasting)
यह देखते हुए कि हमारा पी-मान 0.05 से बहुत बड़ा है, हम यह निष्कर्ष निकाल सकते हैं कि कोई सांख्यिकीय प्रमाण नहीं है जो यह सुझाव देता है कि दोनों तालिकाएँ स्वतंत्र हैं
Fisher's Exact Test for Count Data
data: TeaTasting
p-value = 0.4857
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.2117329 621.9337505
sample estimates:
odds ratio
6.408309