Ausreißer in einem Datensatz finden

Ausreißer sind Datenpunkte, die nicht zum Muster der übrigen Zahlen passen. Dies sind die extrem hohen oder extrem niedrigen Werte im Datensatz.

Eine einfache Möglichkeit, einen Ausreißer zu finden, besteht darin, die Zahlen im Datensatz zu untersuchen. Wir werden sehen, dass die meisten Zahlen um einen Bereich gruppiert sind und einige Zahlen im Vergleich zu den übrigen Zahlen viel zu niedrig oder zu hoch sind. Solche Zahlen werden als Ausreißer bezeichnet.

Other definition of an outlier

Ein Datenpunkt, der deutlich vom Rest der Daten getrennt ist. Eine Definition von Ausreißer ist ein Datenpunkt mit mehr als 1,5 Interquartilbereichen (IQRs) unterhalb des ersten Quartils oder oberhalb des dritten Quartils. Der Interquartilbereich (IQR) ist die Differenz zwischen dem dritten und dem ersten Quartil des Datensatzes.

Finden Sie die Ausreißer für die Daten 0, 2, 5, 6, 9, 12, 35.

Lösung

Für den gegebenen Datensatz haben wir die folgende Zusammenfassung mit fünf Zahlen.

Minimum = 0

erstes Quartil = 2

Median = 6

drittes Quartil = 12

Maximum = 35

IQR = 12 - 2 = 10, also 1,5 · IQR = 15.

Um festzustellen, ob es Ausreißer gibt, müssen wir die Zahlen berücksichtigen, die 1,5 · IQR oder 15 jenseits der Quartile liegen.

erstes Quartil - 1,5 · IQR = 2 - 15 = –13

drittes Quartil + 1,5 · IQR = 12 + 15 = 27

Da 35 außerhalb des Intervalls von –13 bis 27 liegt, ist 35 der Ausreißer in diesem Datensatz.

Finden Sie die Ausreißer in dem unten angegebenen Datensatz.

28, 26, 29, 30, 81, 32, 37

Lösung

Step 1:

Die Daten, die sich von anderen Zahlen im angegebenen Satz unterscheiden, sind 81

Step 2:

Der Ausreißer für diesen Datensatz ist also 81

Finden Sie die Ausreißer in dem unten angegebenen Datensatz.

16, 14, 3, 12, 15, 17, 22, 15, 52

Lösung

Step 1:

Die Daten, die sich von anderen Zahlen im angegebenen Satz unterscheiden, sind 52

Step 2:

Der Ausreißer für diesen Datensatz ist also 52