पियर्सन की ची के वर्ग की स्वतंत्रता के लिए नमूना आकार

Aug 17 2020

मैं एक करने की कोशिश कर रहा हूँ $\chi^2$दो चर के बीच स्वतंत्रता का परीक्षण। मेरे पास समस्या यह है कि मैं परीक्षण के लिए नमूना आकार के साथ संघर्ष कर रहा हूं। मैं हमेशा कुछ कोशिकाओं के साथ समाप्त होता हूं जिनमें 0 नमूने होते हैं।

मेरे पास पूरी आबादी पर उपलब्ध डेटा है, लेकिन मैं इसे परिकल्पना परीक्षण के लिए उपयोग नहीं कर सकता हूं इसलिए मैं प्रतिस्थापन के साथ और बिना विभिन्न आकारों के साथ कोशिश कर रहा हूं। इसके अलावा, जनसंख्या काफी छोटी है - केवल 162।

छोटे नमूना आकारों के chisq()साथ R में फ़ंक्शन त्रुटि संदेशों के साथ आता रहा है कि अनुमान गलत हो सकता है।

> chisq = chisq.test(tbl)
Warning message:
In chisq.test(tbl) : Chi-squared approximation may be incorrect

अब मैं प्रतिस्थापन के साथ 100% आबादी के नमूने के आकार तक गया हूं। त्रुटि गायब हो गई है, लेकिन मैं इससे चिंतित हूं:

क) मेरे पास अभी भी कुछ कोशिकाओं में 0 नमूने हैं :

                       var2_high    var2_low    var2_medium    var2_very_high
  var1_high                12           0             10                 3
  var1_low                 10          20              9                 1
  var1_medium               5          23             19                 0
  var1_very_high            9           0              0                41

और बी) मुझे यकीन नहीं है कि अगर ऐसा नमूना आकार स्वीकार्य है

किसी को भी इन सवालों के साथ मेरी मदद कर सकते हैं?

जवाब

1 nwaldo Aug 18 2020 at 05:08

आप ऊपर संदेश देख रहे हैं क्योंकि नमूना आकार छोटा होने पर ची स्क्वैयर सन्निकटन अविश्वसनीय है। मेरा सुझाव है कि आप मूल डेटा का उपयोग करें और एक फिशर सटीक परीक्षण करें। एक उदाहरण नीचे दिया गया है जब यह समस्या उत्पन्न हो सकती है और हम पूर्वोक्त परीक्षण का उपयोग करके इसे कैसे संबोधित कर सकते हैं।

मान लीजिए हमारे पास निम्न नमूना डेटा है। एक तरफ के रूप में, महिला चखने चाय के प्रयोग से फिशर सटीक परीक्षण बनाया गया था ।

 Truth
Guess  Milk Tea
  Milk    3   1
  Tea     1   3

हम इस परिकल्पना का परीक्षण करना चाहते हैं कि दो चर स्वतंत्र हैं। चि स्क्वेर्ड टेस्ट का उपयोग करने से हमें नीचे चेतावनी मिलती है:

Code:
TeaTasting <- matrix(c(3, 1, 1, 3), 
                     nrow = 2, 
                     dimnames = list(Guess = c("Milk", "Tea"), Truth = c("Milk", "Tea")))

chiSqTest= chisq.test(TeaTasting)
Warning message:
In chisq.test(TeaTasting) : Chi-squared approximation may be incorrect

यह आश्चर्यजनक नहीं है क्योंकि नमूना आकार अपेक्षाकृत छोटा है। इसके अलावा, हम देखते हैं कि अपेक्षित गणना सभी 5 से कम हैं।

chiSqTest$expected
      Truth
Guess  Milk Tea
  Milk    2   2
  Tea     2   2

इस मामले में, हम अपनी परिकल्पना का परीक्षण करने के लिए फिशर सटीक परीक्षण का उपयोग कर सकते हैं।

fisher.test(TeaTasting)

यह देखते हुए कि हमारा पी-मान 0.05 से बहुत बड़ा है, हम यह निष्कर्ष निकाल सकते हैं कि कोई सांख्यिकीय प्रमाण नहीं है जो यह सुझाव देता है कि दोनों तालिकाएँ स्वतंत्र हैं

Fisher's Exact Test for Count Data

data:  TeaTasting
p-value = 0.4857
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
   0.2117329 621.9337505
sample estimates:
odds ratio 
  6.408309