Minimalna wielkość próbki i test mocy
Załóżmy, że mam dostęp do danych o zużyciu energii w mieście o populacji 30000 osób. Wyobraź sobie, że chcę przetestować nową technologię inteligentnej energii, tj. Czy zużycie energii spada dzięki tej technologii. Muszę podzielić 30 000 na mniejszą grupę G, gdzie używają technologii i porównać ją z resztą populacji (gdzie nie mają tej technologii). Następnie mogę wykonać test hipotezy, w którym średnie zużycie energii jest równe w obu grupach, a hipoteza alternatywna jest odwrotna. Aby jednak upewnić się, że technologia była przyczyną zmniejszenia zużycia energii, a nie tylko zbiegiem okoliczności, muszę uzyskać znaczący poziom (np. 0,05) określonego poziomu i minimalną wielkość dla grupy G, prawda?
Przeczytałem również, że należy wykonać test mocy, aby uniknąć błędów typu I i typu II. Ale czy to naprawdę konieczne? Jestem nowy w tym temacie i jest to dla mnie bardzo zagmatwane, ponieważ jest tak wiele różnych formuł i nie wiem, który z nich jest prawidłowy do określenia wielkości grupy G.
Odpowiedzi
Nie jest to bezpośrednia odpowiedź na twoje pytanie, ale ilustruje, jakie informacje należy wprowadzić do procedury „mocy i wielkości próby”, aby uzyskać wymaganą wielkość próby.
Załóżmy, że obecna liczba „jednostek energii” dziennie dla 30 000 gospodarstw domowych wynosi $100.$ Dzięki nowej technologii oczekuje się, że zużycie energii na gospodarstwo domowe będzie rozkładać się normalnie ze średnią $\mu < 100$ z $\sigma = 20.$ Masz nadzieję, że masz moc 90% wykrywania spadku aż o $5$jednostki energii. Więc jeśli konkretna alternatywa $H_a: \mu = 95$ to prawda, chcesz, aby prawdopodobieństwo odrzucenia było $0.9 = 90\%.$
Oczywiście, niektóre z tych „informacji” mogą być nieznane i oparte na domysłach, ale wszystkie powyższe są niezbędnymi danymi wejściowymi. (Możesz eksperymentować z niewielkimi odchyleniami danych wejściowych, aby zobaczyć efekt wyniku).
Oto dane wyjściowe z ostatniej wersji programu Minitab w celu zilustrowania:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus < null)
Calculating power for mean = null + difference
α = 0.05 Assumed standard deviation = 20
Sample Target
Difference Size Power Actual Power
-5 139 0.9 0.901145
Zatem w tym hipotetycznym scenariuszu potrzebna byłaby próbka o wielkości $n = 139$ aby uzyskać pożądaną moc. Poniższy wykres przedstawia moc wykrywania spadku$5$--- wraz z innymi możliwymi spadkami.

Zgodnie z moimi założeniami, wydaje się możliwe, aby zainstalować nową technologię w około 140 domów i zrobić jedną próbę -sample t wyników$H_0: \mu=100$ vs. $H_a: \mu < 100$ na poziomie 5%.
Uwagi: (1) dla normalnej transmisji danych, takie obliczenia stosować poza centrum rozkładu t ze stopniami swobody$n - 1$ oraz parametr niecentralności, który zależy od pożądanej mocy, rozmiaru różnicy do wykrycia i przewidywanego SD populacji dla $n$ obserwacje.
Najważniejsze jest to $n = 129$ obserwacje wystarczą, aby dać 90% potęgi różnicy $5/20 = 1/4$ tak duże jak przewidywane SD.
Możesz przeszukiwać tę witrynę i Internet w celu uzyskania wyjaśnień technicznych na swoim poziomie. Te ostatnie pytania i odpowiedzi mogą być pomocne.
(2) Wiele statystycznych programów komputerowych ma procedury „mocy i wielkości próby”. W języku R jest biblioteka z takimi procedurami dla różnych typów testów. Istnieją witryny internetowe do obliczeń mocy i wielkości próby, ale nie wszystkie z nich są wiarygodne.
(3) R, funkcje prawdopodobieństwa dt
, pt
i tak dalej, mają (rzadko używane) parametr „ncp` parametru nie centralizacji.
Symulacja w R: Przy 100 000 iteracji można spodziewać się dokładności w dwóch miejscach. Tak więc symulacja jest zasadniczo zgodna z wynikami programu Minitab.
set.seed(1121)
pv = replicate(10^5, t.test(rnorm(139, 95, 20), mu=100, alt="less")$p.val)
mean(pv <= 0.05)
[1] 0.89914