Построение модели регрессии

Логистическая регрессия относится к алгоритму машинного обучения, который используется для прогнозирования вероятности категориальной зависимой переменной. В логистической регрессии зависимой переменной является двоичная переменная, которая состоит из данных, закодированных как 1 (логические значения true и false).

В этой главе мы сосредоточимся на разработке регрессионной модели в Python с использованием непрерывной переменной. Пример для модели линейной регрессии будет сосредоточен на исследовании данных из файла CSV.

Цель классификации - предсказать, подпишется ли клиент (1/0) на срочный депозит.

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

Выполните следующие действия, чтобы реализовать приведенный выше код в Anaconda Navigator с помощью «Jupyter Notebook» -

Step 1 - Запустите Jupyter Notebook с Anaconda Navigator.

Step 2 - Загрузите файл csv, чтобы систематически получать выходные данные регрессионной модели.

Step 3 - Создайте новый файл и выполните указанную выше строку кода, чтобы получить желаемый результат.