Statistik - Geschichtete Stichprobe

Diese Strategie zur Untersuchung wird als Teil eines Umstands verwendet, bei dem die Bevölkerung mühelos in Versammlungen oder Schichten aufgeteilt werden kann, die insbesondere nicht ganz gleich sind, die Komponenten innerhalb einer Versammlung jedoch in Bezug auf einige Attribute, z. B. Zweitstudien der Schule, homogen sind kann unter der Voraussetzung der sexuellen Orientierung, der angebotenen Kurse, des Alters usw. in Schichten unterteilt werden. Dabei wird die Population zunächst in Schichten aufgeteilt und anschließend aus jeder Schicht eine unregelmäßige Grundprobe entnommen. Es gibt zwei Arten von geschichteten Tests: verhältnismäßige geschichtete Inspektion und unverhältnismäßige geschichtete Prüfung.

  • Proportionate Stratified Sampling- Dabei ist die Anzahl der aus jeder Schicht ausgewählten Einheiten proportional zum Anteil der Schicht an der Bevölkerung, z. B. an einem College gibt es insgesamt 2500 Studenten, von denen 1500 Studenten in Graduiertenkursen und 1000 in Postgraduiertenkursen eingeschrieben sind. Wenn eine Stichprobe von 100 unter Verwendung einer proportionalen geschichteten Stichprobe ausgewählt werden soll, wäre die Anzahl der Studenten in der Stichprobe 60 und 40 wären Postgraduierte. Somit sind die beiden Schichten in der Stichprobe im gleichen Verhältnis vertreten wie ihre Vertretung in der Bevölkerung.

    Diese Methode eignet sich am besten, wenn der Zweck der Stichprobe darin besteht, den Populationswert eines Merkmals zu schätzen, und es keinen Unterschied bei den Abweichungen innerhalb der Schicht gibt.

  • Disproportionate Stratified Sampling- Wenn der Zweck der Studie darin besteht, die Unterschiede zwischen den Schichten zu vergleichen, müssen aus allen Schichten unabhängig von ihrem Bevölkerungsanteil gleiche Einheiten gezogen werden. Manchmal sind einige Schichten in Bezug auf bestimmte Merkmale variabler als andere Schichten. In einem solchen Fall kann eine größere Anzahl von Einheiten aus den variableren Schichten gezogen werden. In beiden Situationen ist die gezogene Stichprobe eine unverhältnismäßig geschichtete Stichprobe.

    Der Unterschied in der Schichtgröße und der Schichtvariabilität kann unter Verwendung der folgenden Formel zur Bestimmung der Stichprobengröße aus verschiedenen Schichten optimal zugeordnet werden

    Formel

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ für \ i = 1,2 ... k} $

    Wo -

    • $ {n_i} $ = die Stichprobengröße von i Schichten.

    • $ {n} $ = die Größe der Schichten.

    • $ {\ sigma_1} $ = die Standardabweichung von i Schichten.

    Darüber hinaus kann es vorkommen, dass die Kosten für die Entnahme einer Probe in einer Schicht höher sind als in einer anderen. Die optimale unverhältnismäßige Probenahme sollte so erfolgen, dass

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Wobei sich $ {c_1, c_2, ..., c_k} $ auf die Kosten der Stichprobe in k Schichten beziehen. Die Stichprobengröße aus verschiedenen Schichten kann mit folgender Formel bestimmt werden:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ für \ i = 1,2 ... k} $

Beispiel

Problem Statement:

Eine Organisation hat 5000 Mitarbeiter, die in drei Ebenen unterteilt wurden.

  • Schicht A: 50 Führungskräfte mit Standardabweichung = 9

  • Schicht B: 1250 Arbeiter mit Standardabweichung = 4

  • Schicht C: 3700 Arbeiter mit Standardabweichung = 1

Wie wird eine überproportionale Stichprobe von 300 Mitarbeitern mit optimaler Zuordnung gezogen?

Solution:

Verwendung der Formel der unverhältnismäßigen Probenahme für eine optimale Zuordnung.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, Für Stream A {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14.75} \ oder \ say \ {15}} \\ [7pt] \, Für Stream B {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ oder \ say \ {167}} \\ [7pt] \, Für Stream C {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ oder \ say \ {121}} $