Statistiques - Coefficient de corrélation

Coefficient de corrélation

Un coefficient de corrélation est une mesure statistique du degré auquel les changements de la valeur d'une variable prédisent le changement de la valeur d'une autre. Dans les variables positivement corrélées, la valeur augmente ou diminue en tandem. Dans les variables négativement corrélées, la valeur de l'une augmente à mesure que la valeur de l'autre diminue.

Les coefficients de corrélation sont exprimés sous forme de valeurs comprises entre +1 et -1.

Un coefficient de +1 indique une corrélation positive parfaite: un changement de la valeur d'une variable prédira un changement dans le même sens dans la deuxième variable.

Un coefficient de -1 indique un négatif parfait: un changement de la valeur d'une variable prédit un changement dans la direction opposée de la deuxième variable. Les degrés de corrélation inférieurs sont exprimés en décimales non nulles. Un coefficient de zéro indique qu'il n'y a pas de relation discernable entre les fluctuations des variables.

Formule

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ somme y) ^ 2]}}} $

Où -

  • $ {N} $ = Nombre de paires de scores

  • $ {\ sum xy} $ = Somme des produits des scores appariés.

  • $ {\ sum x} $ = Somme des x scores.

  • $ {\ sum y} $ = Somme des y scores.

  • $ {\ sum x ^ 2} $ = Somme des scores x au carré.

  • $ {\ sum y ^ 2} $ = Somme des scores y au carré.

Exemple

Problem Statement:

Calculez le coefficient de corrélation des éléments suivants:

X Oui
1 2
3 5
4 5
4 8

Solution:

$ {\ somme xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ somme x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ somme y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ somme x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $