Membangun Model Regresi

Regresi Logistik mengacu pada algoritma pembelajaran mesin yang digunakan untuk memprediksi probabilitas variabel dependen kategoris. Dalam regresi logistik, variabel terikat adalah variabel biner, yang terdiri dari data yang diberi kode 1 (nilai Boolean benar dan salah).

Pada bab ini, kami akan fokus pada pengembangan model regresi dengan Python menggunakan variabel kontinu. Contoh model regresi linier akan fokus pada eksplorasi data dari file CSV.

Tujuan klasifikasi adalah untuk memprediksi apakah klien akan berlangganan (1/0) ke deposito berjangka.

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

Ikuti langkah-langkah berikut untuk menerapkan kode di atas di Anaconda Navigator dengan "Jupyter Notebook" -

Step 1 - Luncurkan Notebook Jupyter dengan Anaconda Navigator.

Step 2 - Unggah file csv untuk mendapatkan keluaran model regresi secara sistematis.

Step 3 - Buat file baru dan jalankan baris kode yang disebutkan di atas untuk mendapatkan output yang diinginkan.