Estatísticas - Bondade de ajuste

o Goodness of FitO teste é usado para verificar se os dados da amostra correspondem a uma distribuição de uma população. A população pode ter distribuição normal ou distribuição Weibull. Em palavras simples, significa que os dados da amostra representam os dados corretamente que esperamos encontrar na população real. Os seguintes testes são geralmente usados ​​por estatísticos:

  • Chi-square

  • Kolmogorov-Smirnov

  • Anderson-Darling

  • Shipiro-Wilk

Teste Qui-quadrado

O teste qui-quadrado é o mais comumente usado para testar a qualidade dos testes de ajuste e é usado para distribuições discretas como a distribuição binomial e a distribuição de Poisson, enquanto os testes de qualidade de ajuste de Kolmogorov-Smirnov e Anderson-Darling são usados ​​para distribuições contínuas .

Fórmula

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]}} $

Onde -

  • $ {O_i} $ = valor observado do i ésimo nível da variável.

  • $ {E_i} $ = valor esperado do i ésimo nível da variável.

  • $ {X ^ 2} $ = variável aleatória qui-quadrada.

Exemplo

Uma empresa de brinquedos constrói brinquedos para jogadores de futebol. Ele afirma que 30% dos cartões são médios, 60% defensores e 10% são atacantes. Considerando uma amostra aleatória de 100 brinquedos, tem 50 intermediários, 45 defensores e 5 atacantes. Dado o nível de significância de 0,05, você pode justificar a afirmação da empresa?

Solution:

Determinar Hipóteses

  • Null hypothesis $ H_0 $ - A proporção de meio-campistas, defensores e atacantes é de 30%, 60% e 10%, respectivamente.

  • Alternative hypothesis $ H_1 $ - Pelo menos uma das proporções na hipótese nula é falsa.

Determine o grau de liberdade

Os graus de liberdade, DF é igual ao número de níveis (k) da variável categórica menos 1: DF = k - 1. Aqui, os níveis são 3. Assim

$ {DF = k - 1 \\ [7pt] \, = 3 -1 = 2} $

Determine a estatística de teste do qui-quadrado

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}] + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13,33 + 3,75 + 2,50 \\ [7pt] \, = 19,58} $

Determine o valor p

O valor P é a probabilidade de que uma estatística qui-quadrado, $ X ^ 2 $, com 2 graus de liberdade, seja mais extrema do que 19,58. Use a calculadora de distribuição de qui-quadrado para encontrar $ {P (X ^ 2 \ gt 19,58) = 0,0001} $.

Interpretar resultados

Como o valor P (0,0001) é bem menor que o nível de significância (0,05), a hipótese nula não pode ser aceita. Portanto, a reivindicação da empresa é inválida.