Logistic Regression ใน Python - การทดสอบ
เราจำเป็นต้องทดสอบลักษณนามที่สร้างขึ้นข้างต้นก่อนที่จะนำไปใช้ในการผลิต หากการทดสอบพบว่าโมเดลไม่ตรงตามความแม่นยำที่ต้องการเราจะต้องย้อนกลับไปในขั้นตอนข้างต้นเลือกชุดคุณสมบัติอื่น (ช่องข้อมูล) สร้างโมเดลอีกครั้งและทดสอบ นี่จะเป็นขั้นตอนซ้ำ ๆ จนกว่าลักษณนามจะตรงตามความต้องการของคุณในเรื่องความแม่นยำที่ต้องการ ดังนั้นให้เราทดสอบลักษณนามของเรา
การทำนายข้อมูลการทดสอบ
ในการทดสอบลักษณนามเราใช้ข้อมูลการทดสอบที่สร้างขึ้นในขั้นตอนก่อนหน้านี้ เราเรียกว่าpredict วิธีการบนวัตถุที่สร้างขึ้นและส่งไฟล์ X อาร์เรย์ของข้อมูลการทดสอบดังแสดงในคำสั่งต่อไปนี้ -
In [24]: predicted_y = classifier.predict(X_test)
สิ่งนี้จะสร้างอาร์เรย์มิติเดียวสำหรับชุดข้อมูลการฝึกอบรมทั้งหมดโดยให้การคาดคะเนสำหรับแต่ละแถวในอาร์เรย์ X คุณสามารถตรวจสอบอาร์เรย์นี้ได้โดยใช้คำสั่งต่อไปนี้ -
In [25]: predicted_y
ต่อไปนี้เป็นผลลัพธ์จากการดำเนินการสองคำสั่งข้างต้น -
Out[25]: array([0, 0, 0, ..., 0, 0, 0])
ผลลัพธ์ระบุว่าลูกค้าสามรายแรกและสามรายสุดท้ายไม่ใช่ผู้มีโอกาสเป็นลูกค้าสำหรับ Term Deposit. คุณสามารถตรวจสอบอาร์เรย์ทั้งหมดเพื่อแยกแยะผู้มีโอกาสเป็นลูกค้า โดยใช้ข้อมูลโค้ด Python ต่อไปนี้ -
In [26]: for x in range(len(predicted_y)):
if (predicted_y[x] == 1):
print(x, end="\t")
ผลลัพธ์ของการรันโค้ดด้านบนแสดงไว้ด้านล่าง -
ผลลัพธ์จะแสดงดัชนีของแถวทั้งหมดที่เป็นผู้สมัครที่น่าจะสมัครสมาชิก TD ตอนนี้คุณสามารถให้ผลลัพธ์นี้แก่ทีมการตลาดของธนาคารซึ่งจะรับรายละเอียดการติดต่อของลูกค้าแต่ละรายในแถวที่เลือกและดำเนินการต่อไป
ก่อนที่เราจะนำแบบจำลองนี้ไปใช้ในการผลิตเราจำเป็นต้องตรวจสอบความถูกต้องของการทำนาย
การตรวจสอบความถูกต้อง
ในการทดสอบความถูกต้องของแบบจำลองให้ใช้วิธีการให้คะแนนบนลักษณนามที่แสดงด้านล่าง -
In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))
ผลลัพธ์หน้าจอของการรันคำสั่งนี้แสดงไว้ด้านล่าง -
Accuracy: 0.90
แสดงให้เห็นว่าความแม่นยำของโมเดลของเราคือ 90% ซึ่งถือว่าดีมากในการใช้งานส่วนใหญ่ ดังนั้นจึงไม่จำเป็นต้องปรับแต่งเพิ่มเติม ตอนนี้ลูกค้าของเราพร้อมที่จะใช้งานแคมเปญถัดไปรับรายชื่อผู้มีโอกาสเป็นลูกค้าและไล่ล่าพวกเขาเพื่อเปิด TD ด้วยอัตราความสำเร็จที่สูง