Construindo um modelo de regressão

A regressão logística refere-se ao algoritmo de aprendizado de máquina usado para prever a probabilidade da variável dependente categórica. Na regressão logística, a variável dependente é a variável binária, que consiste em dados codificados como 1 (valores booleanos de verdadeiro e falso).

Neste capítulo, vamos nos concentrar no desenvolvimento de um modelo de regressão em Python usando variável contínua. O exemplo de modelo de regressão linear enfocará na exploração de dados do arquivo CSV.

O objetivo da classificação é prever se o cliente assinará (1/0) um depósito a prazo.

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

Siga estas etapas para implementar o código acima no Anaconda Navigator com “Jupyter Notebook” -

Step 1 - Inicie o Notebook Jupyter com o Anaconda Navigator.

Step 2 - Carregue o arquivo csv para obter a saída do modelo de regressão de maneira sistemática.

Step 3 - Crie um novo arquivo e execute a linha de código mencionada acima para obter a saída desejada.