Logistic Regression ใน Python - การทดสอบ

เราจำเป็นต้องทดสอบลักษณนามที่สร้างขึ้นข้างต้นก่อนที่จะนำไปใช้ในการผลิต หากการทดสอบพบว่าโมเดลไม่ตรงตามความแม่นยำที่ต้องการเราจะต้องย้อนกลับไปในขั้นตอนข้างต้นเลือกชุดคุณสมบัติอื่น (ช่องข้อมูล) สร้างโมเดลอีกครั้งและทดสอบ นี่จะเป็นขั้นตอนซ้ำ ๆ จนกว่าลักษณนามจะตรงตามความต้องการของคุณในเรื่องความแม่นยำที่ต้องการ ดังนั้นให้เราทดสอบลักษณนามของเรา

การทำนายข้อมูลการทดสอบ

ในการทดสอบลักษณนามเราใช้ข้อมูลการทดสอบที่สร้างขึ้นในขั้นตอนก่อนหน้านี้ เราเรียกว่าpredict วิธีการบนวัตถุที่สร้างขึ้นและส่งไฟล์ X อาร์เรย์ของข้อมูลการทดสอบดังแสดงในคำสั่งต่อไปนี้ -

In [24]: predicted_y = classifier.predict(X_test)

สิ่งนี้จะสร้างอาร์เรย์มิติเดียวสำหรับชุดข้อมูลการฝึกอบรมทั้งหมดโดยให้การคาดคะเนสำหรับแต่ละแถวในอาร์เรย์ X คุณสามารถตรวจสอบอาร์เรย์นี้ได้โดยใช้คำสั่งต่อไปนี้ -

In [25]: predicted_y

ต่อไปนี้เป็นผลลัพธ์จากการดำเนินการสองคำสั่งข้างต้น -

Out[25]: array([0, 0, 0, ..., 0, 0, 0])

ผลลัพธ์ระบุว่าลูกค้าสามรายแรกและสามรายสุดท้ายไม่ใช่ผู้มีโอกาสเป็นลูกค้าสำหรับ Term Deposit. คุณสามารถตรวจสอบอาร์เรย์ทั้งหมดเพื่อแยกแยะผู้มีโอกาสเป็นลูกค้า โดยใช้ข้อมูลโค้ด Python ต่อไปนี้ -

In [26]: for x in range(len(predicted_y)):
   if (predicted_y[x] == 1):
      print(x, end="\t")

ผลลัพธ์ของการรันโค้ดด้านบนแสดงไว้ด้านล่าง -

ผลลัพธ์จะแสดงดัชนีของแถวทั้งหมดที่เป็นผู้สมัครที่น่าจะสมัครสมาชิก TD ตอนนี้คุณสามารถให้ผลลัพธ์นี้แก่ทีมการตลาดของธนาคารซึ่งจะรับรายละเอียดการติดต่อของลูกค้าแต่ละรายในแถวที่เลือกและดำเนินการต่อไป

ก่อนที่เราจะนำแบบจำลองนี้ไปใช้ในการผลิตเราจำเป็นต้องตรวจสอบความถูกต้องของการทำนาย

การตรวจสอบความถูกต้อง

ในการทดสอบความถูกต้องของแบบจำลองให้ใช้วิธีการให้คะแนนบนลักษณนามที่แสดงด้านล่าง -

In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))

ผลลัพธ์หน้าจอของการรันคำสั่งนี้แสดงไว้ด้านล่าง -

Accuracy: 0.90

แสดงให้เห็นว่าความแม่นยำของโมเดลของเราคือ 90% ซึ่งถือว่าดีมากในการใช้งานส่วนใหญ่ ดังนั้นจึงไม่จำเป็นต้องปรับแต่งเพิ่มเติม ตอนนี้ลูกค้าของเราพร้อมที่จะใช้งานแคมเปญถัดไปรับรายชื่อผู้มีโอกาสเป็นลูกค้าและไล่ล่าพวกเขาเพื่อเปิด TD ด้วยอัตราความสำเร็จที่สูง