Estatísticas - Função Outlier

Um outlier em uma função de distribuição de probabilidade é um número que é mais de 1,5 vezes o comprimento do conjunto de dados longe dos quartis inferior ou superior. Especificamente, se um número for menor que $ {Q_1 - 1,5 \ vezes IQR} $ ou maior que $ {Q_3 + 1,5 \ vezes IQR} $, então é um outlier.

Outlier é definido e dado pela seguinte função de probabilidade:

Fórmula

$ {Outlier \ datas \ are \, \ lt Q_1 - 1,5 \ times IQR \ (ou) \ \ gt Q_3 + 1,5 \ times IQR} $

Onde -

  • $ {Q_1} $ = primeiro quartil

  • $ {Q_2} $ = terceiro quartil

  • $ {IQR} $ = intervalo interquartil

Exemplo

Problem Statement:

Considere um conjunto de dados que representa a contagem de tarefas periódicas de 8 alunos diferentes. O conjunto de informações de contagem de tarefas é 11, 13, 15, 3, 16, 25, 12 e 14. Descubra os dados atípicos das contagens de tarefas periódicas dos alunos.

Solution:

O conjunto de dados fornecido é:

11 13 15 3 16 25 12 14

Organize em ordem crescente:

3 11 12 13 14 15 16 25

Valor do primeiro quartil () $ {Q_1} $

$ {Q_1 = \ frac {(11 + 12)} {2} \\ [7pt] \ = 11,5} $

Valor do terceiro quartil () $ {Q_3} $

$ {Q_3 = \ frac {(15 + 16)} {2} \\ [7pt] \ = 15,5} $

Intervalo de valores discrepantes inferior (L)

$ {Q_1 - 1,5 \ vezes IQR \\ [7pt] \ = 11,5 - (1,5 \ vezes 4) \\ [7pt] \ = 11,5 - 6 \\ [7pt] \ = 5,5} $

Faixa Outlier Superior (L)

$ {Q_3 + 1,5 \ vezes IQR \\ [7pt] \ = 15,5 + (1,5 \ vezes 4) \\ [7pt] \ = 15,5 + 6 \\ [7pt] \ = 21,5} $

Nas informações fornecidas, 5,5 e 21,5 é maior do que os outros valores no conjunto de dados fornecido, ou seja, exceto de 3 e 25, uma vez que 3 é maior que 5,5 e 25 é menor que 21,5.

Dessa forma, utilizamos 3 e 25 como os valores atípicos.