統計-層化抽出

調査のためのこの戦略は、人口が特に互いにまったく同じではない集会または層に簡単に分割できる状況の一部として利用されますが、集会内のコンポーネントは、いくつかの属性、たとえば学校の研究に関して均一です性的指向、提供されるコース、年齢などを前提として、層に分けることができます。この場合、母集団は最初に層に分割され、その後、基本的な不規則な標本がすべての層から採取されます。層化テストには、比例層化検査と不均衡層化検査の2種類があります。

  • Proportionate Stratified Sampling-この場合、各階層から選択されるユニットの数は、人口の階層のシェアに比例します。たとえば、大学には合計2500人の学生がおり、そのうち1500人の学生が大学院コースに登録され、1000人が大学院コースに登録されています。比例層化サンプリングを使用して100のサンプルを選択する場合、サンプルの学部生の数は60人になり、40人は大学院生になります。したがって、2つの層は、母集団での表現と同じ比率でサンプルで表現されます。

    この方法は、サンプリングの目的が何らかの特性の母集団値を推定することであり、層内分散に差がない場合に最適です。

  • Disproportionate Stratified Sampling-研究の目的が層間の違いを比較することである場合、人口のシェアに関係なく、すべての層から等しい単位を引き出すことが必要になります。一部の層は、他の層よりもいくつかの特性に関してより可変である場合があります。そのような場合、より可変の層からより多くのユニットが引き出される可能性があります。どちらの状況でも、抽出されたサンプルは不均化層化サンプルです。

    層のサイズと層の変動性の違いは、さまざまな層からのサンプルサイズを決定するために、次の式を使用して最適に割り当てることができます。

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $

    ここで-

    • $ {n_i} $ = i層のサンプルサイズ。

    • $ {n} $ =層のサイズ。

    • $ {\ sigma_1} $ = istrataの標準偏差。

    それに加えて、サンプルを収集するコストが、ある層では他の層よりも高くなる場合があります。最適な不均衡なサンプリングは、次のような方法で行う必要があります。

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    ここで、$ {c_1、c_2、...、c_k} $は、k層でのサンプリングのコストを示します。異なる層からのサンプルサイズは、次の式を使用して決定できます。

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $

Problem Statement:

組織には、3つのレベルに階層化された5000人の従業員がいます。

  • 層A:標準偏差= 9の50人のエグゼクティブ

  • 層B:標準偏差= 4の1250人の非手動労働者

  • 層C:標準偏差= 1の3700人の手動作業員

300人の従業員のサンプルが、最適な割り当てで不均衡にどのように抽出されますか?

Solution:

最適な割り当てのために不均化サンプリングの式を使用します。

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \、ストリームAの場合、{n_1 = \ frac {300(50)(9 )} {(50)(9)+(1250)(4)+(3700)(1)}} \\ [7pt] \、= {\ frac {135000} {1950} = {14.75} \または\ say \ {15}} \\ [7pt] \、ストリームBの場合、{n_1 = \ frac {300(1250)(4)} {(50)(9)+(1250)(4)+(3700)(1 )}} \\ [7pt] \、= {\ frac {150000} {1950} = {163.93} \ or \ say \ {167}} \\ [7pt] \、ストリームCの場合、{n_1 = \ frac { 300(3700)(1)} {(50)(9)+(1250)(4)+(3700)(1)}} \\ [7pt] \、= {\ frac {110000} {1950} = { 121.3} \または\ say \ {121}} $