Statistik ist ein bisschen eine Mischung aus Mathematik und Wahrscheinlichkeit. Der Zweck der Statistik besteht darin, Prozesse zu beschreiben, die Sie in der Welt beobachten können – die Höhe von Eichen oder die Wahrscheinlichkeit, dass ein Impfstoff zur Abwehr von Krankheiten wirkt – ohne jede Eiche auf der Welt messen oder jeden Menschen impfen zu müssen, bevor Sie entscheiden, wie wirksam ein Medikament ist.
Da die Wahrscheinlichkeit Dinge beschreibt, die mit dem Zufall verbunden sind, müssen wir akzeptieren, dass wir bei jedem Prozess, den wir mit Statistiken messen, niemals das vollständige Bild erhalten werden.
Warum Statistiken verwenden?
Angenommen, Sie werfen eine Münze viermal. Sie erhalten drei Köpfe und einen Schwanz. Ohne die Verwendung von Statistiken könnten wir zu dem Schluss kommen, dass die Wahrscheinlichkeit, Kopf zu bekommen, 75 Prozent beträgt, wobei die tatsächliche Wahrscheinlichkeit, bei einem Münzwurf Kopf zu bekommen, 1:1 oder eine 50:50-Chance beträgt. Wenn wir stattdessen 40 Münzwürfe machen würden, würden wir einem Verhältnis von Kopf zu Zahl von 1:1 sicherlich viel näher kommen, und die Verwendung von Statistiken würde dies widerspiegeln.
„Ein Großteil der Statistik hat damit zu tun, ausgehend von einer Stichprobe – den tatsächlichen Beobachtungen – auf Merkmale der Bevölkerung – alles mögliche Beobachtungen – zu schließen“, sagt John Drake, Forschungsprofessor am Center for the Ecology of Infectious Diseases an der University of Georgia. in einer E-Mail. „Zum Beispiel könnte uns die Höhe von Eichen interessieren. Wir können nicht alle Eichen auf der Welt messen, aber wir können einige messen. Wir können die durchschnittliche Höhe von Eichen in der Stichprobe berechnen, aber das wird Es muss nicht unbedingt der Durchschnitt aller Eichen sein.“
Vertrauensintervalle
Da wir nicht alle Eichen der Welt messen können, kommen Statistiker auf der Grundlage der Wahrscheinlichkeit und aller ihnen zur Verfügung stehenden Daten zu einem geschätzten Höhenbereich. Dieser Bereich wird Konfidenzintervall genannt und besteht aus zwei Zahlen: einer, die wahrscheinlich kleiner als der wahre Wert ist, und einer, die wahrscheinlich größer ist. Der wahre Wert liegt wahrscheinlich irgendwo dazwischen.
„Ein ‚95-Prozent-Konfidenzintervall‘ bedeutet, dass 95 von 100 Mal, dass das Konfidenzintervall auf diese Weise konstruiert wird, das Intervall den wahren Wert enthält“, sagt Drake. „Wenn wir Proben von Eichen 100 Mal messen würden, würde das Konfidenzintervall basierend auf den Daten, die in 95 dieser Experimente gesammelt wurden, den Populationsmittelwert oder die durchschnittliche Höhe aller Eichen enthalten. Daher ist ein Konfidenzintervall ein Maß für die Genauigkeit einer Schätzung. Die Schätzung wird immer genauer, je mehr Daten gesammelt werden. Deshalb werden die Konfidenzintervalle kleiner, je mehr Daten verfügbar sind.“
Ein Konfidenzintervall hilft also zu zeigen, wie gut oder schlecht die Schätzung ist. Wenn wir eine Münze nur viermal werfen, hat unsere Schätzung von 75 Prozent ein breites Konfidenzintervall, da unsere Stichprobengröße sehr klein ist. Unsere Schätzung mit 40 Münzwürfen hätte ein viel engeres Konfidenzintervall.
Die eigentliche Bedeutung eines Konfidenzintervalls hat damit zu tun, dass ein Experiment immer wieder wiederholt wird. Im Fall der vier Münzwürfe bedeutet ein Konfidenzintervall von 95 Prozent, dass, wenn wir das Münzwurfexperiment 100 Mal wiederholen, unsere Wahrscheinlichkeit, Kopf zu bekommen, in 95 von diesen Fällen in dieses Konfidenzintervall fällt.
Die Grenzen der Statistik
Der Statistik sind Grenzen gesetzt. Sie müssen eine gute Studie entwerfen – Statistiken können Ihnen nichts sagen, was Sie nicht gefragt haben.
Angenommen, Sie untersuchen die Wirksamkeit eines Impfstoffs, haben aber keine Kinder in Ihre Studie aufgenommen. Sie können auf der Grundlage der von Ihnen gesammelten Daten ein Konfidenzintervall erstellen, aber es sagt Ihnen nichts darüber aus, wie gut der Impfstoff Kinder schützt.
„Neben ausreichend Daten muss die Stichprobe auch repräsentativ sein“, sagt Drake. „Normalerweise bedeutet dies, eine Zufallsstichprobe oder eine stratifizierte Zufallsstichprobe zu haben. Angenommen, die 1.000 Teilnehmer Ihrer hypothetischen Impfstoffstudie sind repräsentativ für die Bevölkerung, dann ist es vernünftig zu folgern, dass die wahre Wirksamkeit des Impfstoffs innerhalb des angegebenen Konfidenzintervalls liegt. Wenn die Stichprobe nicht repräsentativ ist – wenn sie keine Kinder umfasst – dann gibt es keine statistische Grundlage, um Rückschlüsse auf den nicht repräsentierten Teil der Bevölkerung zu ziehen.“
Das ist jetzt interessant:
Florence Nightingale war eine der wichtigsten Statistikerinnen der Geschichte und nutzte die von ihr entwickelte Wissenschaft, um das Leben von Soldaten während des Krimkrieges zu retten.