Probabilidade - Covariância e Correlação

Dec 04 2022
A variável A tem relação com a variável B? Se tivermos dados de altura e peso, queremos analisar a relação entre essas duas variáveis. A resposta está usando análise de covariância e correlação.
Foto de Isaac Smith no Unsplash

A variável A tem relação com a variável B?

Se tivermos dados de altura e peso, queremos analisar a relação entre essas duas variáveis. A resposta está usando análise de covariância e correlação.

Covariância

Visualização de covariância

A covariância é usada para descobrir se duas variáveis ​​estão relacionadas ou não. O que precisa ser visto é se o valor é positivo ou negativo. Se for positivo, eles se movem na mesma direção (covariância positiva). Se for negativo, eles estão se movendo na direção oposta (Covariância Negativa). O valor da covariância não pode descrever o quão forte é o relacionamento.

Fórmula de Covariância

Onde:

  • x̄ = média de x
  • ȳ = média de y
  • xᵢ e yᵢ são os pontos de observação de x e y
  • n = número de observações

Correlação

Podemos usar a correlação se quisermos saber quão forte é a relação entre duas variáveis. Os valores de covariância podem variar porque a escala dos números também é diferente. Portanto, a correlação é usada como resultado da normalização da covariância com um valor de -1 a 1. Dividimos a covariância com uma variância raiz de x e y, respectivamente, e obtemos um coeficiente de correlação que varia entre -1 a +1.

Fórmula de correlação

COV ( x, y ) = covariância das variáveis ​​x e y
σ 2 x = variância amostral da variável x
σ 2 y = variância amostral da variável y

Significado do coeficiente de correlação

Como interpretar a correlação: A direção da correlação pode ser conhecida pelo seu valor, positivo ou negativo. Uma correlação positiva significa que um aumento em uma variável causa um valor adicional na outra variável. Vice-versa na correlação negativa. A correlação é forte se o valor se aproximar de 1 ou -1. Enquanto isso, quanto mais próximo de 0, mais fraca a correlação ou nenhuma correlação.

Palavras Finais

Parabéns por manter-se até este ponto! Espero que você tenha aprendido algo novo com este artigo.

Depois de ler este artigo, você deve saber como encontrar a relação entre duas variáveis. Se você gosta do conteúdo, siga minha conta no Medium para receber uma notificação sobre minhas postagens futuras!

Sobre mim

Um entusiasta de dados que constantemente se desenvolve e se desafia em vários aspectos, ávido por aprender e aberto a novas experiências. Atualmente contribuindo como Analista de Dados Junior na Grouu Baby Food.

Confira o GitHub do Ariq para saber mais sobre ele! Por fim, se você tiver dúvidas ou tópicos para discutir, entre em contato com Ariq via LinkedIn .

Referências:

[1] Bertsekas, D., & Tsitsiklis, JN (2008). Introdução à probabilidade (Vol. 1). Atena Científica.

[2]https://towardsdatascience.com/getting-the-basics-of-correlation-covariance-c8fc110b90b4