การสร้างแบบจำลองการถดถอย
Logistic Regression หมายถึงอัลกอริทึมการเรียนรู้ของเครื่องที่ใช้ในการทำนายความน่าจะเป็นของตัวแปรตามหมวดหมู่ ในการถดถอยโลจิสติกตัวแปรตามคือตัวแปรไบนารีซึ่งประกอบด้วยข้อมูลที่เข้ารหัสเป็น 1 (ค่าบูลีนเป็นจริงและเท็จ)
ในบทนี้เราจะมุ่งเน้นไปที่การพัฒนาแบบจำลองการถดถอยใน Python โดยใช้ตัวแปรต่อเนื่อง ตัวอย่างสำหรับโมเดลการถดถอยเชิงเส้นจะเน้นไปที่การสำรวจข้อมูลจากไฟล์ CSV
เป้าหมายการจัดประเภทคือการทำนายว่าลูกค้าจะสมัคร (1/0) เพื่อฝากระยะหรือไม่
import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt
plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split
import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))
ทำตามขั้นตอนเหล่านี้เพื่อติดตั้งโค้ดด้านบนใน Anaconda Navigator ด้วย“ Jupyter Notebook” -
Step 1 - เปิดตัว Jupyter Notebook พร้อม Anaconda Navigator
Step 2 - อัปโหลดไฟล์ csv เพื่อรับผลลัพธ์ของแบบจำลองการถดถอยอย่างเป็นระบบ
Step 3 - สร้างไฟล์ใหม่และดำเนินการตามโค้ดข้างต้นเพื่อให้ได้ผลลัพธ์ที่ต้องการ