न्यूनतम नमूना आकार और शक्ति परीक्षण
मान लीजिए कि मेरे पास 30000 लोगों की आबादी वाले शहर की ऊर्जा खपत पर डेटा तक पहुंच है। कल्पना कीजिए कि मैं स्मार्ट ऊर्जा की एक नई तकनीक का परीक्षण करना चाहता हूं, अगर इस तकनीक के साथ ऊर्जा की खपत कम हो जाती है। मुझे 30k को एक छोटे समूह G में कम करने की आवश्यकता है जहां वे प्रौद्योगिकी का उपयोग करते हैं और इसकी तुलना बाकी आबादी (जहां उनके पास यह तकनीक नहीं है) से करते हैं। फिर मैं एक परिकल्पना परीक्षण कर सकता हूं जहां ऊर्जा की खपत का मतलब दोनों समूहों में समान है और वैकल्पिक परिकल्पना विपरीत है। हालांकि, यह सुनिश्चित करने के लिए कि प्रौद्योगिकी ऊर्जा की खपत कम होने का कारण थी और न केवल एक संयोग है, मुझे एक निश्चित स्तर और समूह जी के लिए एक न्यूनतम आकार का एक महत्वपूर्ण स्तर (जैसे 0.05) प्राप्त करने की आवश्यकता है, है ना?
मैंने यह भी पढ़ा कि टाइप I और टाइप II त्रुटियों से बचने के लिए एक शक्ति परीक्षण किया जाना चाहिए। लेकिन क्या यह वास्तव में आवश्यक है? मैं इस विषय के लिए नया हूँ और यह मेरे लिए बहुत उलझन की बात है क्योंकि बहुत सारे सूत्र हैं और मुझे नहीं पता कि समूह जी के आकार को निर्धारित करने के लिए कौन सा सही है।
जवाब
यह आपके प्रश्न का सीधा उत्तर नहीं है, लेकिन यह आवश्यक नमूना आकार प्राप्त करने के लिए आपको 'पावर और सैंपल साइज़' प्रक्रिया के इनपुट के लिए कौन सी जानकारी की आवश्यकता है, यह स्पष्ट करता है।
मान लें कि 30,000 घरों के लिए प्रति दिन "ऊर्जा इकाइयों" की वर्तमान संख्या है $100.$ नई तकनीक से आप उम्मीद करते हैं कि ऊर्जा की खपत प्रति घर के साथ सामान्य रूप से वितरित की जाएगी $\mu < 100$ साथ में $\sigma = 20.$ आप के रूप में ज्यादा की कमी का पता लगाने के 90% शक्ति की उम्मीद है $5$ऊर्जा इकाइयाँ। इसलिए यदि विशेष विकल्प $H_a: \mu = 95$ सच है कि आप अस्वीकृति संभावना चाहते हैं $0.9 = 90\%.$
सुनिश्चित करने के लिए, इस "सूचना" में से कुछ अज्ञात और सट्टा हो सकता है, लेकिन उपरोक्त सभी आवश्यक इनपुट है। (आउटपुट के प्रभाव को देखने के लिए आप इनपुट के थोड़े बदलाव के साथ प्रयोग कर सकते हैं।)
यहाँ मिनिटैब की हालिया रिलीज़ से चित्रण करने के लिए आउटपुट है:
Power and Sample Size 
1-Sample t Test
Testing mean = null (versus < null)
Calculating power for mean = null + difference
α = 0.05  Assumed standard deviation = 20
            Sample  Target
Difference    Size   Power  Actual Power
        -5     139     0.9      0.901145
तो इस काल्पनिक परिदृश्य में आपको एक नमूना आकार की आवश्यकता होगी $n = 139$ वांछित शक्ति प्राप्त करने के लिए। निम्नलिखित ग्राफ में कमी का पता लगाने के लिए शक्ति को दर्शाता है$5$--- अन्य संभावित घटने के साथ।
 
                मेरी मान्यताओं के तहत, नई तकनीक को लगभग 140 घरों में स्थापित करना और परिणामों का एक- स्तरीय परीक्षण करना संभव है$H_0: \mu=100$ बनाम $H_a: \mu < 100$ 5% के स्तर पर।
नोट्स: (1) सामान्य आंकड़ों के लिए, इस तरह की गणना स्वतंत्रता की डिग्री के साथ एक गैर-केंद्रीय टी वितरण का उपयोग करती है$n - 1$ और एक गैर-केंद्रीयता पैरामीटर जो वांछित शक्ति पर निर्भर करता है, पता लगाने के लिए अंतर का आकार और अनुमानित जनसंख्या एसडी $n$ टिप्पणियों।
महत्वपूर्ण तथ्य यह है कि $n = 129$ अवलोकनों में अंतर के 90% शक्ति देने के लिए पर्याप्त है $5/20 = 1/4$ प्रत्याशित SD जितना बड़ा।
आप अपने स्तर पर तकनीकी स्पष्टीकरण के लिए इस साइट और इंटरनेट पर खोज कर सकते हैं। यह हालिया Q & A मददगार हो सकता है।
(2) कई सांख्यिकीय कंप्यूटर कार्यक्रमों में 'शक्ति और नमूना आकार' प्रक्रियाएं होती हैं। विभिन्न प्रकार के परीक्षणों के लिए ऐसी प्रक्रियाओं के साथ आर में एक पुस्तकालय है। बिजली और नमूना आकार की गणना के लिए ऑनलाइन साइटें हैं, लेकिन वे सभी विश्वसनीय नहीं हैं।
(3) आर में, संभाव्यता फ़ंक्शंस dt, ptऔर इसी तरह गैर-केंद्रीयता पैरामीटर के लिए एक (शायद ही कभी इस्तेमाल किया गया) पैरामीटर 'एनसीपी' हो।
आर में सिमुलेशन: 100,000 पुनरावृत्तियों के साथ, कोई दो-स्थान सटीकता के बारे में उम्मीद कर सकता है। इसलिए सिमुलेशन मिनिटैब आउटपुट के साथ आवश्यक समझौते में है।
set.seed(1121)
pv = replicate(10^5, t.test(rnorm(139, 95, 20), mu=100, alt="less")$p.val)
mean(pv <= 0.05)
[1] 0.89914