Encontrando outliers em um conjunto de dados
Outliers são pontos de dados que não se enquadram no padrão do restante dos números. Eles são os valores extremamente altos ou extremamente baixos no conjunto de dados.
Uma maneira simples de encontrar um outlier é examinar os números no conjunto de dados. Veremos que a maioria dos números está agrupada em torno de um intervalo e alguns números são muito baixos ou muito altos em comparação com o resto dos números. Esses números são conhecidos como outliers.
Other definition of an outlier
Um ponto de dados distintamente separado do resto dos dados. Uma definição de outlier é qualquer ponto de dados superior a 1,5 intervalos interquartílicos (IQRs) abaixo do primeiro quartil ou acima do terceiro quartil. O intervalo interquartil (IQR) é a diferença entre o terceiro quartil e o primeiro quartil do conjunto de dados.
Encontre o (s) outlier (s) para os dados 0, 2, 5, 6, 9, 12, 35.
Solução
Para determinado conjunto de dados, temos o seguinte resumo de cinco números.
mínimo = 0
primeiro quartil = 2
mediana = 6
terceiro quartil = 12
máximo = 35
IQR = 12 - 2 = 10, então 1,5 · IQR = 15.
Para determinar se há outliers, devemos considerar os números que são 1,5 · IQR ou 15 além dos quartis.
primeiro quartil - 1,5 · IQR = 2 - 15 = –13
terceiro quartil + 1,5 · IQR = 12 + 15 = 27
Como 35 está fora do intervalo de –13 a 27, 35 é o valor discrepante neste conjunto de dados.
Encontre o (s) outlier (s) no conjunto de dados fornecido abaixo.
28, 26, 29, 30, 81, 32, 37
Solução
Step 1:
Os dados que são diferentes de outros números no conjunto fornecido são 81
Step 2:
Portanto, o outlier para este conjunto de dados é 81
Encontre o (s) outlier (s) no conjunto de dados fornecido abaixo.
16, 14, 3, 12, 15, 17, 22, 15, 52
Solução
Step 1:
Os dados que são diferentes de outros números no conjunto fornecido são 52
Step 2:
Portanto, o outlier para este conjunto de dados é 52