Logistic Regression ใน Python - กรณีศึกษา

พิจารณาว่าธนาคารเข้าใกล้คุณในการพัฒนาแอปพลิเคชันแมชชีนเลิร์นนิงที่จะช่วยพวกเขาในการระบุผู้มีโอกาสเป็นลูกค้าที่จะเปิดการฝากระยะ (หรือที่เรียกว่าการฝากประจำโดยธนาคารบางแห่ง) กับพวกเขา ธนาคารจะทำการสำรวจอย่างสม่ำเสมอโดยการโทรทางโทรศัพท์หรือเว็บฟอร์มเพื่อรวบรวมข้อมูลเกี่ยวกับผู้มีโอกาสเป็นลูกค้า การสำรวจเป็นเรื่องทั่วไปและดำเนินการกับผู้ชมจำนวนมากซึ่งหลายคนอาจไม่สนใจที่จะจัดการกับธนาคารนี้เอง จากที่เหลือมีเพียงไม่กี่คนเท่านั้นที่สนใจที่จะเปิดฝากระยะ คนอื่น ๆ อาจสนใจสิ่งอำนวยความสะดวกอื่น ๆ ที่ธนาคารนำเสนอ ดังนั้นจึงไม่จำเป็นต้องทำการสำรวจเพื่อระบุลูกค้าที่เปิด TD งานของคุณคือการระบุลูกค้าทั้งหมดที่มีความเป็นไปได้สูงที่จะเปิด TD จากข้อมูลการสำรวจขนาดใหญ่ที่ธนาคารจะแบ่งปันกับคุณ

โชคดีที่ข้อมูลประเภทนี้เปิดเผยต่อสาธารณะสำหรับผู้ที่ต้องการพัฒนาโมเดลแมชชีนเลิร์นนิง ข้อมูลนี้จัดทำโดยนักเรียนบางคนที่ UC Irvine ด้วยเงินทุนภายนอก ฐานข้อมูลพร้อมใช้งานเป็นส่วนหนึ่งของUCI Machine Learning Repositoryและใช้กันอย่างแพร่หลายโดยนักเรียนนักการศึกษาและนักวิจัยทั่วโลก ข้อมูลที่สามารถดาวน์โหลดได้จากที่นี่

ในบทถัดไปให้เราดำเนินการพัฒนาแอปพลิเคชันโดยใช้ข้อมูลเดียวกัน