Python - Teste Qui-Quadrado

O teste qui-quadrado é um método estatístico para determinar se duas variáveis ​​categóricas têm uma correlação significativa entre elas. Ambas as variáveis ​​devem ser da mesma população e devem ser categóricas como - Sim / Não, Masculino / Feminino, Vermelho / Verde, etc. Por exemplo, podemos construir um conjunto de dados com observações sobre o padrão de compra de sorvete das pessoas e tentar correlacionar o gênero de uma pessoa com o sabor do sorvete de sua preferência. Se uma correlação for encontrada, podemos planejar o estoque apropriado de sabores, sabendo o número de gênero das pessoas que os visitam.

Usamos várias funções na biblioteca numpy para realizar o teste do qui-quadrado.

from scipy import stats import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 10, 100) fig,ax = plt.subplots(1,1) linestyles = [':', '--', '-.', '-'] deg_of_freedom = [1, 4, 7, 6] for df, ls in zip(deg_of_freedom, linestyles): ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls) plt.xlim(0, 10) plt.ylim(0, 0.4) plt.xlabel('Value') plt.ylabel('Frequency') plt.title('Chi-Square Distribution') plt.legend() plt.show()

Está output é o seguinte -