Thống kê - Chức năng Outlier

Giá trị ngoại lệ trong hàm phân phối xác suất là một số có độ dài lớn hơn 1,5 lần độ dài của tập dữ liệu tính từ phần tư dưới hoặc phần tư trên. Cụ thể, nếu một số nhỏ hơn $ {Q_1 - 1,5 \ times IQR} $ hoặc lớn hơn $ {Q_3 + 1,5 \ times IQR} $, thì đó là một số ngoại lệ.

Ngoại lệ được xác định và cho bởi hàm xác suất sau:

Công thức

$ {Outlier \ datas \ are \, \ lt Q_1 - 1,5 \ lần IQR \ (hoặc) \ \ gt Q_3 + 1,5 \ lần IQR} $

Ở đâu -

  • $ {Q_1} $ = Phần tư thứ nhất

  • $ {Q_2} $ = Phần tư thứ ba

  • $ {IQR} $ = Dải phần tư giữa các

Thí dụ

Problem Statement:

Hãy xem xét một tập dữ liệu đại diện cho số lượng nhiệm vụ định kỳ của 8 học sinh khác nhau. Tập thông tin về số nhiệm vụ là, 11, 13, 15, 3, 16, 25, 12 và 14. Khám phá dữ liệu ngoại lệ từ số nhiệm vụ định kỳ của học sinh.

Solution:

Tập dữ liệu đã cho là:

11 13 15 3 16 25 12 14

Sắp xếp nó theo thứ tự tăng dần:

3 11 12 13 14 15 16 25

Giá trị phần tư đầu tiên () $ {Q_1} $

$ {Q_1 = \ frac {(11 + 12)} {2} \\ [7pt] \ = 11,5} $

Giá trị phần tư thứ ba () $ {Q_3} $

$ {Q_3 = \ frac {(15 + 16)} {2} \\ [7pt] \ = 15,5} $

Dải Outlier thấp hơn (L)

$ {Q_1 - 1,5 \ lần IQR \\ [7pt] \ = 11,5 - (1,5 \ lần 4) \\ [7pt] \ = 11,5 - 6 \\ [7pt] \ = 5,5} $

Phạm vi ngoại lệ trên (L)

$ {Q_3 + 1,5 \ lần IQR \\ [7pt] \ = 15,5 + (1,5 \ lần 4) \\ [7pt] \ = 15,5 + 6 \\ [7pt] \ = 21,5} $

Trong thông tin đã cho, 5,5 và 21,5 lớn hơn các giá trị khác trong tập dữ liệu đã cho, tức là ngoại trừ 3 và 25 vì 3 lớn hơn 5,5 và 25 nhỏ hơn 21,5.

Theo cách này, chúng tôi sử dụng 3 và 25 làm giá trị ngoại lệ.