Python - Kiểm tra Chi-Square
Kiểm định Chi-Square là một phương pháp thống kê để xác định xem hai biến phân loại có mối tương quan đáng kể giữa chúng hay không. Cả hai biến đó phải từ cùng một quần thể và chúng phải được phân loại như - Có / Không, Nam / Nữ, Đỏ / Xanh lá, v.v. Ví dụ, chúng ta có thể xây dựng một tập dữ liệu với các quan sát về mô hình mua kem của mọi người và cố gắng tương quan giới tính của một người với hương vị của món kem mà họ thích. Nếu tìm thấy mối tương quan, chúng tôi có thể lập kế hoạch cho kho hương vị phù hợp bằng cách biết số lượng giới tính của những người ghé thăm.
Chúng tôi sử dụng các hàm khác nhau trong thư viện numpy để thực hiện kiểm tra chi-square.
from scipy import stats
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 10, 100)
fig,ax = plt.subplots(1,1)
linestyles = [':', '--', '-.', '-']
deg_of_freedom = [1, 4, 7, 6]
for df, ls in zip(deg_of_freedom, linestyles):
ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls)
plt.xlim(0, 10)
plt.ylim(0, 0.4)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Chi-Square Distribution')
plt.legend()
plt.show()
Nó là output như sau -