Statistik - Korrelationskoeffizient

Korrelationskoeffizient

Ein Korrelationskoeffizient ist ein statistisches Maß für den Grad, in dem Änderungen des Werts einer Variablen eine Änderung des Werts einer anderen Variablen vorhersagen. Bei positiv korrelierten Variablen steigt oder sinkt der Wert gleichzeitig. Bei negativ korrelierten Variablen nimmt der Wert der einen zu, wenn der Wert der anderen abnimmt.

Korrelationskoeffizienten werden als Werte zwischen +1 und -1 ausgedrückt.

Ein Koeffizient von +1 zeigt eine perfekte positive Korrelation an: Eine Änderung des Werts einer Variablen sagt eine Änderung derselben Richtung in der zweiten Variablen voraus.

Ein Koeffizient von -1 zeigt ein perfektes Negativ an: Eine Änderung des Werts einer Variablen sagt eine Änderung der entgegengesetzten Richtung in der zweiten Variablen voraus. Geringere Korrelationsgrade werden als Nicht-Null-Dezimalstellen ausgedrückt. Ein Koeffizient von Null zeigt an, dass kein Zusammenhang zwischen Schwankungen der Variablen erkennbar ist.

Formel

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Wo -

  • $ {N} $ = Anzahl der Punktepaare

  • $ {\ sum xy} $ = Summe der Produkte gepaarter Partituren.

  • $ {\ sum x} $ = Summe der x Punkte.

  • $ {\ sum y} $ = Summe der y-Punkte.

  • $ {\ sum x ^ 2} $ = Summe der quadratischen x-Punkte.

  • $ {\ sum y ^ 2} $ = Summe der quadratischen y-Werte.

Beispiel

Problem Statement:

Berechnen Sie den Korrelationskoeffizienten von Folgendem:

X. Y.
1 2
3 5
4 5
4 8

Solution:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $