Bir Regresyon Modeli Oluşturmak

Lojistik Regresyon, kategorik bağımlı değişkenin olasılığını tahmin etmek için kullanılan makine öğrenme algoritmasını ifade eder. Lojistik regresyonda, bağımlı değişken, 1 olarak kodlanmış verilerden oluşan ikili değişkendir (doğru ve yanlış Boole değerleri).

Bu bölümde, sürekli değişken kullanarak Python'da bir regresyon modeli geliştirmeye odaklanacağız. Doğrusal regresyon modeli örneği, CSV dosyasından veri keşfine odaklanacaktır.

Sınıflandırma hedefi, müşterinin vadeli depozitoya abone olup olmayacağını (1/0) tahmin etmektir.

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

Yukarıdaki kodu Anaconda Navigator'da "Jupyter Notebook" ile uygulamak için şu adımları izleyin -

Step 1 - Anaconda Navigator ile Jupyter Notebook'u başlatın.

Step 2 - Sistematik bir şekilde regresyon modelinin çıktısını almak için csv dosyasını yükleyin.

Step 3 - Yeni bir dosya oluşturun ve istenen çıktıyı elde etmek için yukarıda belirtilen kod satırını yürütün.