Mindestprobengröße und Leistungstest

Nov 22 2020

Angenommen, ich habe Zugang zu Daten über den Energieverbrauch einer Stadt mit 30000 Einwohnern. Stellen Sie sich vor, ich möchte eine neue Technologie für intelligente Energie testen, dh wenn der Energieverbrauch mit dieser Technologie abnimmt. Ich muss die 30.000 in eine kleinere Gruppe G unterteilen, in der sie die Technologie verwenden, und sie mit dem Rest der Bevölkerung vergleichen (wo sie diese Technologie nicht haben). Dann kann ich einen Hypothesentest durchführen, bei dem der Mittelwert des Energieverbrauchs in beiden Gruppen gleich ist und die alternative Hypothese das Gegenteil ist. Um jedoch sicherzustellen, dass die Technologie der Grund für die Reduzierung des Energieverbrauchs war und nicht nur ein Zufall, muss ich ein signifikantes Niveau (z. B. 0,05) eines bestimmten Niveaus und eine Mindestgröße für die Gruppe G erreichen, oder?

Ich habe auch gelesen, dass ein Leistungstest durchgeführt werden muss, um Fehler vom Typ I und Typ II zu vermeiden. Aber ist das wirklich notwendig? Ich bin neu in diesem Thema und das ist sehr verwirrend für mich, weil es so viele verschiedene Formeln gibt und ich nicht weiß, welche richtig ist, um die Größe der Gruppe G zu bestimmen.

Antworten

2 BruceET Nov 23 2020 at 19:17

Dies ist keine direkte Antwort auf Ihre Frage, zeigt jedoch, welche Informationen Sie für ein Verfahren "Leistung und Stichprobengröße" eingeben müssen, um die erforderliche Stichprobengröße zu erhalten.

Nehmen wir an, die aktuelle Anzahl von "Energieeinheiten" pro Tag für 30.000 Haushalte beträgt $100.$ Mit der neuen Technologie erwarten Sie, dass der Energieverbrauch pro Haushalt normal mit dem Mittelwert verteilt wird $\mu < 100$ mit $\sigma = 20.$ Sie hoffen, dass die Leistung 90% der Erkennungsabnahme von bis zu 90% beträgt $5$Energieeinheiten. Also wenn die besondere Alternative $H_a: \mu = 95$ ist wahr, Sie möchten die Ablehnungswahrscheinlichkeit sein $0.9 = 90\%.$

Natürlich sind einige dieser "Informationen" unbekannt und spekulativ, aber alle oben genannten Informationen sind notwendige Eingaben. (Sie können mit geringfügigen Abweichungen der Eingabe experimentieren, um den Effekt der Ausgabe zu sehen.)

Hier ist eine Ausgabe einer kürzlich veröffentlichten Version von Minitab, um dies zu veranschaulichen:

Power and Sample Size 

1-Sample t Test

Testing mean = null (versus < null)
Calculating power for mean = null + difference
α = 0.05  Assumed standard deviation = 20

            Sample  Target
Difference    Size   Power  Actual Power
        -5     139     0.9      0.901145

In diesem hypothetischen Szenario benötigen Sie also eine Stichprobengröße von $n = 139$ um die gewünschte Leistung zu erhalten. Die folgende Grafik zeigt die Leistung zum Erkennen einer Abnahme von$5$--- zusammen mit anderen möglichen Abnahmen.

Unter meinen Annahmen erscheint es machbar, die neue Technologie in etwa 140 Häusern zu installieren und einen Ein- Stichproben-Test der Ergebnisse durchzuführen$H_0: \mu=100$ vs. $H_a: \mu < 100$ auf dem 5% -Niveau.

Anmerkungen: (1) Für normale Daten verwenden solche Berechnungen eine nicht zentrale t-Verteilung mit Freiheitsgraden$n - 1$ und einen Nicht-Zentralitätsparameter, der von der gewünschten Leistung, der Größe des zu erfassenden Unterschieds und der erwarteten Populations-SD für die $n$ Beobachtungen.

Die entscheidende Tatsache ist, dass $n = 129$ Beobachtungen reichen aus, um eine Differenz von 90% zu erhalten $5/20 = 1/4$ so groß wie die erwartete SD.

Sie können diese Site und das Internet nach technischen Erklärungen auf Ihrer Ebene durchsuchen. Diese jüngsten Fragen und Antworten können hilfreich sein.

(2) Viele statistische Computerprogramme verfügen über Verfahren für Leistung und Stichprobengröße. In R gibt es eine Bibliothek mit solchen Verfahren für eine Vielzahl von Testtypen. Es gibt Online-Sites für Berechnungen der Leistung und der Stichprobengröße, aber nicht alle sind zuverlässig.

(3) In R, die Wahrscheinlichkeitsfunktionen dt, ptund haben so auf eine (selten verwendet) Parameter ‚ncp` für die nicht-zentrale Parameter.

Simulation in R: Mit 100.000 Iterationen kann man eine Genauigkeit von zwei Stellen erwarten. Die Simulation stimmt also im Wesentlichen mit der Minitab-Ausgabe überein.

set.seed(1121)
pv = replicate(10^5, t.test(rnorm(139, 95, 20), mu=100, alt="less")$p.val)
mean(pv <= 0.05)
[1] 0.89914