Estatísticas - Função Outlier
Um outlier em uma função de distribuição de probabilidade é um número que é mais de 1,5 vezes o comprimento do conjunto de dados longe dos quartis inferior ou superior. Especificamente, se um número for menor que $ {Q_1 - 1,5 \ vezes IQR} $ ou maior que $ {Q_3 + 1,5 \ vezes IQR} $, então é um outlier.
Outlier é definido e dado pela seguinte função de probabilidade:
Fórmula
$ {Outlier \ datas \ are \, \ lt Q_1 - 1,5 \ times IQR \ (ou) \ \ gt Q_3 + 1,5 \ times IQR} $
Onde -
$ {Q_1} $ = primeiro quartil
$ {Q_2} $ = terceiro quartil
$ {IQR} $ = intervalo interquartil
Exemplo
Problem Statement:
Considere um conjunto de dados que representa a contagem de tarefas periódicas de 8 alunos diferentes. O conjunto de informações de contagem de tarefas é 11, 13, 15, 3, 16, 25, 12 e 14. Descubra os dados atípicos das contagens de tarefas periódicas dos alunos.
Solution:
O conjunto de dados fornecido é:
11 | 13 | 15 | 3 | 16 | 25 | 12 | 14 |
Organize em ordem crescente:
3 | 11 | 12 | 13 | 14 | 15 | 16 | 25 |
Valor do primeiro quartil () $ {Q_1} $
$ {Q_1 = \ frac {(11 + 12)} {2} \\ [7pt] \ = 11,5} $
Valor do terceiro quartil () $ {Q_3} $
$ {Q_3 = \ frac {(15 + 16)} {2} \\ [7pt] \ = 15,5} $
Intervalo de valores discrepantes inferior (L)
$ {Q_1 - 1,5 \ vezes IQR \\ [7pt] \ = 11,5 - (1,5 \ vezes 4) \\ [7pt] \ = 11,5 - 6 \\ [7pt] \ = 5,5} $
Faixa Outlier Superior (L)
$ {Q_3 + 1,5 \ vezes IQR \\ [7pt] \ = 15,5 + (1,5 \ vezes 4) \\ [7pt] \ = 15,5 + 6 \\ [7pt] \ = 21,5} $
Nas informações fornecidas, 5,5 e 21,5 é maior do que os outros valores no conjunto de dados fornecido, ou seja, exceto de 3 e 25, uma vez que 3 é maior que 5,5 e 25 é menor que 21,5.
Dessa forma, utilizamos 3 e 25 como os valores atípicos.