Estatísticas - Amostragem estratificada

Esta estratégia de exame é utilizada como parte da circunstância em que a população pode ser facilmente dividida em grupos ou estratos que não são exatamente iguais uns aos outros, mas os componentes dentro de um grupo são homogêneos em relação a alguns atributos, por exemplo, alunos substitutos da escola podem ser separados em estratos com base na orientação sexual, cursos oferecidos, idade e assim por diante. Nesse caso, a população é inicialmente dividida em estratos e depois um espécime básico irregular é retirado de cada estrato. O teste estratificado é de dois tipos: inspeção estratificada proporcional e exame estratificado desproporcional.

  • Proportionate Stratified Sampling- Neste, o número de unidades selecionadas de cada estrato é proporcional à participação do estrato na população, por exemplo, em uma faculdade, há um total de 2.500 alunos, dos quais 1.500 alunos estão matriculados em cursos de graduação e 1.000 estão matriculados em cursos de pós-graduação. Se uma amostra de 100 for escolhida usando amostragem estratificada proporcional, o número de alunos de graduação na amostra seria 60 e 40 seriam alunos de pós-graduação. Assim, os dois estratos são representados na mesma proporção na amostra que sua representação na população.

    Este método é mais adequado quando o objetivo da amostragem é estimar o valor populacional de alguma característica e não há diferença nas variâncias dentro do estrato.

  • Disproportionate Stratified Sampling- Quando o objetivo do estudo é comparar as diferenças entre os estratos, torna-se necessário extrair unidades iguais de todos os estratos, independentemente de sua participação na população. Às vezes, alguns estratos são mais variáveis ​​em relação a alguma característica do que outros estratos; nesse caso, um número maior de unidades pode ser extraído dos estratos mais variáveis. Em ambas as situações, a amostra retirada é uma amostra estratificada desproporcional.

    A diferença no tamanho do estrato e na variabilidade do estrato pode ser alocada de forma otimizada usando a seguinte fórmula para determinar o tamanho da amostra de diferentes estratos

    Fórmula

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ para \ i = 1,2 ... k} $

    Onde -

    • $ {n_i} $ = o tamanho da amostra de estratos i.

    • $ {n} $ = o tamanho dos estratos.

    • $ {\ sigma_1} $ = o desvio padrão dos estratos i.

    Além disso, pode haver uma situação em que o custo de coleta de uma amostra pode ser mais em um estrato do que em outro. A amostragem desproporcional ideal deve ser feita de uma maneira que

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Onde $ {c_1, c_2, ..., c_k} $ se referem ao custo de amostragem em k estratos. O tamanho da amostra de diferentes estratos pode ser determinado usando a seguinte fórmula:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ para \ i = 1,2 ... k} $

Exemplo

Problem Statement:

Uma organização possui 5.000 funcionários que foram estratificados em três níveis.

  • Estrato A: 50 executivos com desvio padrão = 9

  • Estrato B: 1250 trabalhadores não manuais com desvio padrão = 4

  • Estrato C: 3700 trabalhadores manuais com desvio padrão = 1

Como uma amostra de 300 funcionários será sorteada em uma base desproporcional tendo uma alocação ótima?

Solution:

Usando a fórmula de amostragem desproporcional para uma alocação ótima.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, Para o fluxo A, {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14,75} \ ou \ dizer \ {15}} \\ [7pt] \, Para o Fluxo B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163,93} \ ou \ say \ {167}} \\ [7pt] \, Para o Fluxo C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121,3} \ ou \ diga \ {121}} $