Probabilité — Covariance et corrélation

Dec 04 2022
La variable A a-t-elle une relation avec la variable B ? Si nous avons des données de taille et de poids, nous voulons analyser la relation entre ces deux variables. La réponse consiste à utiliser l'analyse de covariance et de corrélation.
Photo par Isaac Smith sur Unsplash

La variable A a-t-elle une relation avec la variable B ?

Si nous avons des données de taille et de poids, nous voulons analyser la relation entre ces deux variables. La réponse consiste à utiliser l'analyse de covariance et de corrélation.

Covariance

Visualisation des covariances

La covariance est utilisée pour savoir si deux variables sont liées ou non. Ce qu'il faut voir, c'est si la valeur est positive ou négative. S'il est positif, ils se déplacent dans la même direction (covariance positive). S'il est négatif, ils se déplacent dans la direction opposée (covariance négative). La valeur de covariance ne peut pas décrire la force de la relation.

Formule de covariance

Où:

  • x̄ = moyenne de x
  • ȳ = moyenne de y
  • xᵢ et yᵢ sont le point d'observation de x et y
  • n = nombre d'observations

Corrélation

Nous pouvons utiliser la corrélation si nous voulons connaître la force de la relation entre deux variables. Les valeurs de covariance peuvent varier car l'échelle des nombres est également différente. Ainsi, la corrélation est utilisée à la suite de la normalisation de la covariance avec une valeur de -1 à 1. Nous divisons la covariance avec une variance racine de x et y, respectivement, et obtenons un coefficient de corrélation qui varie entre -1 et +1.

Formule de corrélation

COV ( x, y ) = covariance des variables x et y
σ 2 x = variance d'échantillon de la variable x
σ 2 y = variance d'échantillon de la variable y

Signification du coefficient de corrélation

Comment interpréter la corrélation : Le sens de la corrélation peut être connu à partir de sa valeur, positive ou négative. Une corrélation positive signifie qu'une augmentation d'une variable entraîne une valeur supplémentaire dans l'autre variable. Vice versa dans la corrélation négative. La corrélation est forte si la valeur se rapproche de 1 ou -1. Pendant ce temps, plus il est proche de 0, plus la corrélation est faible ou pas de corrélation.

Derniers mots

Félicitations pour avoir tenu jusqu'ici ! J'espère que vous avez appris quelque chose de nouveau grâce à cet article.

Après avoir lu cet article, vous devriez savoir comment trouver une relation entre deux variables. Si vous aimez le contenu, veuillez suivre mon compte Medium pour recevoir une notification de mes futurs articles !

À propos de moi

Un passionné de données qui se développe constamment et se met au défi dans divers aspects, désireux d'apprendre et ouvert à de nouvelles expériences. Contribue actuellement en tant qu'analyste de données junior chez Grouu Baby Food.

Consultez le GitHub d'Ariq pour en savoir plus sur lui ! Enfin, si vous avez des questions ou des sujets à discuter, veuillez contacter Ariq via LinkedIn .

Références:

[1] Bertsekas, D., & Tsitsiklis, JN (2008). Introduction à la probabilité (Vol. 1). Athéna Scientifique.

[2]https://towardsdatascience.com/getting-the-basics-of-correlation-covariance-c8fc110b90b4