Encontrar valores atípicos en un conjunto de datos

Los valores atípicos son puntos de datos que no se ajustan al patrón del resto de los números. Son los valores extremadamente altos o extremadamente bajos del conjunto de datos.

Una forma sencilla de encontrar un valor atípico es examinar los números en el conjunto de datos. Veremos que la mayoría de los números están agrupados alrededor de un rango y algunos números son demasiado bajos o demasiado altos en comparación con el resto de los números. Estos números se conocen como valores atípicos.

Other definition of an outlier

Un punto de datos que está claramente separado del resto de los datos. Una definición de valor atípico es cualquier punto de datos con más de 1,5 rangos intercuartílicos (IQR) por debajo del primer cuartil o por encima del tercer cuartil. El rango intercuartil (IQR) es la diferencia entre el tercer cuartil y el primer cuartil del conjunto de datos.

Encuentre los valores atípicos para los datos 0, 2, 5, 6, 9, 12, 35.

Solución

Para un conjunto de datos dado, tenemos el siguiente resumen de cinco números.

mínimo = 0

primer cuartil = 2

mediana = 6

tercer cuartil = 12

máximo = 35

IQR = 12 - 2 = 10, entonces 1.5 · IQR = 15.

Para determinar si hay valores atípicos, debemos considerar los números que están 1.5 · IQR o 15 más allá de los cuartiles.

primer cuartil - 1,5 · IQR = 2 - 15 = –13

tercer cuartil + 1,5 · IQR = 12 + 15 = 27

Dado que 35 está fuera del intervalo de –13 a 27, 35 es el valor atípico en este conjunto de datos.

Encuentre los valores atípicos en el conjunto de datos proporcionado a continuación.

28, 26, 29, 30, 81, 32, 37

Solución

Step 1:

Los datos que son diferentes de otros números en el conjunto dado son 81

Step 2:

Entonces, el valor atípico para este conjunto de datos es 81

Encuentre los valores atípicos en el conjunto de datos proporcionado a continuación.

16, 14, 3, 12, 15, 17, 22, 15, 52

Solución

Step 1:

Los datos que son diferentes de otros números en el conjunto dado son 52

Step 2:

Entonces, el valor atípico para este conjunto de datos es 52