Probabilidade - Covariância e Correlação
A variável A tem relação com a variável B?
Se tivermos dados de altura e peso, queremos analisar a relação entre essas duas variáveis. A resposta está usando análise de covariância e correlação.
Covariância

A covariância é usada para descobrir se duas variáveis estão relacionadas ou não. O que precisa ser visto é se o valor é positivo ou negativo. Se for positivo, eles se movem na mesma direção (covariância positiva). Se for negativo, eles estão se movendo na direção oposta (Covariância Negativa). O valor da covariância não pode descrever o quão forte é o relacionamento.

Onde:
- x̄ = média de x
- ȳ = média de y
- xᵢ e yᵢ são os pontos de observação de x e y
- n = número de observações
Correlação
Podemos usar a correlação se quisermos saber quão forte é a relação entre duas variáveis. Os valores de covariância podem variar porque a escala dos números também é diferente. Portanto, a correlação é usada como resultado da normalização da covariância com um valor de -1 a 1. Dividimos a covariância com uma variância raiz de x e y, respectivamente, e obtemos um coeficiente de correlação que varia entre -1 a +1.

COV ( x, y ) = covariância das variáveis x e y
σ 2 x = variância amostral da variável x
σ 2 y = variância amostral da variável y

Como interpretar a correlação: A direção da correlação pode ser conhecida pelo seu valor, positivo ou negativo. Uma correlação positiva significa que um aumento em uma variável causa um valor adicional na outra variável. Vice-versa na correlação negativa. A correlação é forte se o valor se aproximar de 1 ou -1. Enquanto isso, quanto mais próximo de 0, mais fraca a correlação ou nenhuma correlação.
Palavras Finais
Parabéns por manter-se até este ponto! Espero que você tenha aprendido algo novo com este artigo.
Depois de ler este artigo, você deve saber como encontrar a relação entre duas variáveis. Se você gosta do conteúdo, siga minha conta no Medium para receber uma notificação sobre minhas postagens futuras!
Sobre mim
Um entusiasta de dados que constantemente se desenvolve e se desafia em vários aspectos, ávido por aprender e aberto a novas experiências. Atualmente contribuindo como Analista de Dados Junior na Grouu Baby Food.
Confira o GitHub do Ariq para saber mais sobre ele! Por fim, se você tiver dúvidas ou tópicos para discutir, entre em contato com Ariq via LinkedIn .
Referências:
[1] Bertsekas, D., & Tsitsiklis, JN (2008). Introdução à probabilidade (Vol. 1). Atena Científica.
[2]https://towardsdatascience.com/getting-the-basics-of-correlation-covariance-c8fc110b90b4