Python - การทดสอบ Chi-Square

การทดสอบไคสแควร์เป็นวิธีการทางสถิติเพื่อตรวจสอบว่าตัวแปรเชิงหมวดหมู่สองตัวแปรมีความสัมพันธ์กันอย่างมีนัยสำคัญหรือไม่ ตัวแปรทั้งสองควรมาจากประชากรกลุ่มเดียวกันและควรอยู่ในหมวดหมู่เช่น - ใช่ / ไม่ใช่ชาย / หญิงสีแดง / เขียวเป็นต้นตัวอย่างเช่นเราสามารถสร้างชุดข้อมูลโดยมีการสังเกตรูปแบบการซื้อไอศกรีมของผู้คนและพยายามให้สัมพันธ์กัน เพศของบุคคลที่มีรสชาติของไอศกรีมที่ตนชอบ หากพบความสัมพันธ์เราสามารถวางแผนสำหรับสต็อกของรสชาติที่เหมาะสมได้โดยทราบจำนวนเพศของผู้ที่เข้าเยี่ยมชม

เราใช้ฟังก์ชันต่างๆในไลบรารี numpy เพื่อทำการทดสอบไคสแควร์

from scipy import stats import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 10, 100) fig,ax = plt.subplots(1,1) linestyles = [':', '--', '-.', '-'] deg_of_freedom = [1, 4, 7, 6] for df, ls in zip(deg_of_freedom, linestyles): ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls) plt.xlim(0, 10) plt.ylim(0, 0.4) plt.xlabel('Value') plt.ylabel('Frequency') plt.title('Chi-Square Distribution') plt.legend() plt.show()

มัน output มีดังนี้ -