Probabilité — Covariance et corrélation
La variable A a-t-elle une relation avec la variable B ?
Si nous avons des données de taille et de poids, nous voulons analyser la relation entre ces deux variables. La réponse consiste à utiliser l'analyse de covariance et de corrélation.
Covariance

La covariance est utilisée pour savoir si deux variables sont liées ou non. Ce qu'il faut voir, c'est si la valeur est positive ou négative. S'il est positif, ils se déplacent dans la même direction (covariance positive). S'il est négatif, ils se déplacent dans la direction opposée (covariance négative). La valeur de covariance ne peut pas décrire la force de la relation.

Où:
- x̄ = moyenne de x
- ȳ = moyenne de y
- xᵢ et yᵢ sont le point d'observation de x et y
- n = nombre d'observations
Corrélation
Nous pouvons utiliser la corrélation si nous voulons connaître la force de la relation entre deux variables. Les valeurs de covariance peuvent varier car l'échelle des nombres est également différente. Ainsi, la corrélation est utilisée à la suite de la normalisation de la covariance avec une valeur de -1 à 1. Nous divisons la covariance avec une variance racine de x et y, respectivement, et obtenons un coefficient de corrélation qui varie entre -1 et +1.

COV ( x, y ) = covariance des variables x et y
σ 2 x = variance d'échantillon de la variable x
σ 2 y = variance d'échantillon de la variable y

Comment interpréter la corrélation : Le sens de la corrélation peut être connu à partir de sa valeur, positive ou négative. Une corrélation positive signifie qu'une augmentation d'une variable entraîne une valeur supplémentaire dans l'autre variable. Vice versa dans la corrélation négative. La corrélation est forte si la valeur se rapproche de 1 ou -1. Pendant ce temps, plus il est proche de 0, plus la corrélation est faible ou pas de corrélation.
Derniers mots
Félicitations pour avoir tenu jusqu'ici ! J'espère que vous avez appris quelque chose de nouveau grâce à cet article.
Après avoir lu cet article, vous devriez savoir comment trouver une relation entre deux variables. Si vous aimez le contenu, veuillez suivre mon compte Medium pour recevoir une notification de mes futurs articles !
À propos de moi
Un passionné de données qui se développe constamment et se met au défi dans divers aspects, désireux d'apprendre et ouvert à de nouvelles expériences. Contribue actuellement en tant qu'analyste de données junior chez Grouu Baby Food.
Consultez le GitHub d'Ariq pour en savoir plus sur lui ! Enfin, si vous avez des questions ou des sujets à discuter, veuillez contacter Ariq via LinkedIn .
Références:
[1] Bertsekas, D., & Tsitsiklis, JN (2008). Introduction à la probabilité (Vol. 1). Athéna Scientifique.
[2]https://towardsdatascience.com/getting-the-basics-of-correlation-covariance-c8fc110b90b4