Estadísticas - Prueba de Kolmogorov Smirnov

Esta prueba se utiliza en situaciones en las que se debe realizar una comparación entre una distribución de muestra observada y una distribución teórica.

Prueba de una muestra de KS

Esta prueba se utiliza como prueba de bondad de ajuste y es ideal cuando el tamaño de la muestra es pequeño. Compara la función de distribución acumulada de una variable con una distribución especificada. La hipótesis nula asume que no hay diferencia entre la distribución observada y teórica y el valor del estadístico de prueba 'D' se calcula como:

Fórmula

$D = Maximum |F_o(X)-F_r(X)|$

Donde -

  • ${F_o(X)}$ = Distribución de frecuencia acumulada observada de una muestra aleatoria de n observaciones.

  • y ${F_o(X) = \frac{k}{n}}$ = (No de observaciones ≤ X) / (No total de observaciones).

  • ${F_r(X)}$ = La distribución de frecuencia teórica.

El valor crítico de ${D}$ se encuentra a partir de los valores de la tabla KS para una prueba de muestra.

Acceptance Criteria: Si el valor calculado es menor que el valor crítico, acepte la hipótesis nula.

Rejection Criteria: Si el valor calculado es mayor que el valor de la tabla, rechace la hipótesis nula.

Ejemplo

Problem Statement:

En un estudio realizado a partir de varias corrientes de una universidad, se entrevistó a 60 estudiantes, con el mismo número de estudiantes extraídos de cada corriente, y se señaló su intención de unirse al Club de Drama de la universidad.

  B.Sc. licenciado en Letras B.Com MAMÁ M.Com
No. en cada clase 5 9 11 dieciséis 19

Se esperaba que 12 estudiantes de cada clase se unieran al Club de Drama. Usar la prueba KS para encontrar si hay alguna diferencia entre las clases de los estudiantes con respecto a su intención de unirse al Drama Club

Solution:

${H_o}$: No hay diferencia entre los estudiantes de diferentes corrientes con respecto a su intención de unirse al club de teatro.

Desarrollamos las frecuencias acumulativas para distribuciones teóricas y observadas.

Corrientes No. de estudiantes interesados ​​en unirse ${F_O(X)}$ ${F_T(X)}$ ${|F_O(X)-F_T(X)|}$
  Observado
(O)
Teórico
(T)
     
B.Sc. 5 12 5/60 12/60 7/60
licenciado en Letras 9 12 14/60 24/60 10/60
B.COM. 11 12 25/60 36/60 11/60
MAMÁ dieciséis 12 41/60 48/60 7/60
M.COM. 19 12 60/40 60/60 60/60
Total n = 60        

Estadística de prueba ${|D|}$ se calcula como:

$D = Maximum {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$

El valor de la tabla de D a un nivel de significancia del 5% viene dado por

${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$

Dado que el valor calculado es mayor que el valor crítico, rechazamos la hipótesis nula y concluimos que existe una diferencia entre los estudiantes de diferentes corrientes en su intención de unirse al Club.

Prueba de dos muestras KS

Cuando en lugar de una, hay dos muestras independientes, entonces se puede usar la prueba de dos muestras KS para probar la concordancia entre dos distribuciones acumulativas. La hipótesis nula establece que no hay diferencia entre las dos distribuciones. El estadístico D se calcula de la misma manera que la prueba de una muestra de KS.

Fórmula

${D = Maximum |{F_n}_1(X)-{F_n}_2(X)|}$

Donde -

  • ${n_1}$ = Observaciones de la primera muestra.

  • ${n_2}$ = Observaciones de la segunda muestra.

Se ha visto que cuando las distribuciones acumuladas muestran una gran desviación máxima ${|D|}$ está indicando una diferencia entre las dos distribuciones muestrales.

El valor crítico de D para muestras donde ${n_1 = n_2}$y es ≤ 40, se utiliza la tabla KS para dos casos de muestra. Cuando${n_1}$ y / o ${n_2}$> 40, entonces se debe utilizar la tabla KS para muestras grandes de dos pruebas de muestra. Se acepta la hipótesis nula si el valor calculado es menor que el valor de la tabla y viceversa.

Por lo tanto, el uso de cualquiera de estas pruebas no paramétricas ayuda al investigador a probar la importancia de sus resultados cuando se desconocen las características de la población objetivo o no se han hecho suposiciones sobre ellas.