Tìm những điểm khác biệt trong Tập dữ liệu
Các điểm ngoại lai là các điểm dữ liệu không phù hợp với mô hình của các con số còn lại. Chúng là các giá trị cực cao hoặc cực thấp trong tập dữ liệu.
Một cách đơn giản để tìm ra ngoại lệ là kiểm tra các con số trong tập dữ liệu. Chúng ta sẽ thấy rằng hầu hết các số đều được nhóm xung quanh một phạm vi và một số số quá thấp hoặc quá cao so với phần còn lại của các số. Những con số như vậy được gọi là ngoại lệ.
Other definition of an outlier
Một điểm dữ liệu tách biệt rõ ràng với phần còn lại của dữ liệu. Một định nghĩa về giá trị ngoại lệ là bất kỳ điểm dữ liệu nào nhiều hơn 1,5 phạm vi liên phần tư (IQR) bên dưới phần tư đầu tiên hoặc trên phần tư thứ ba. Phạm vi liên phần tư (IQR) là sự khác biệt giữa phần tư thứ ba và phần tư đầu tiên của tập dữ liệu.
Tìm (các) giá trị ngoại lai cho dữ liệu 0, 2, 5, 6, 9, 12, 35.
Giải pháp
Đối với tập dữ liệu đã cho, chúng tôi có bản tóm tắt năm số sau đây.
tối thiểu = 0
phần tư đầu tiên = 2
trung vị = 6
phần tư thứ ba = 12
tối đa = 35
IQR = 12 - 2 = 10, do đó 1,5 · IQR = 15.
Để xác định xem có các giá trị ngoại lệ hay không, chúng ta phải xem xét các con số 1,5 · IQR hoặc 15 nằm ngoài các phần tư.
phần tư thứ nhất - 1,5 · IQR = 2 - 15 = –13
phần tư thứ ba + 1,5 · IQR = 12 + 15 = 27
Vì 35 nằm ngoài khoảng từ –13 đến 27, 35 là giá trị ngoại lệ trong tập dữ liệu này.
Tìm (các) ngoại lệ trong tập dữ liệu đã cho bên dưới.
28, 26, 29, 30, 81, 32, 37
Giải pháp
Step 1:
Dữ liệu khác với các số khác trong tập hợp đã cho là 81
Step 2:
Vì vậy, giá trị ngoại lệ cho tập dữ liệu này là 81
Tìm (các) ngoại lệ trong tập dữ liệu đã cho bên dưới.
16, 14, 3, 12, 15, 17, 22, 15, 52
Giải pháp
Step 1:
Dữ liệu khác với các số khác trong tập hợp đã cho là 52
Step 2:
Vì vậy, giá trị ngoại lệ cho tập dữ liệu này là 52