Construire un modèle de régression
La régression logistique fait référence à l'algorithme d'apprentissage automatique utilisé pour prédire la probabilité d'une variable dépendante catégorielle. Dans la régression logistique, la variable dépendante est une variable binaire, qui se compose de données codées 1 (valeurs booléennes de vrai et faux).
Dans ce chapitre, nous nous concentrerons sur le développement d'un modèle de régression en Python utilisant une variable continue. L'exemple de modèle de régression linéaire se concentrera sur l'exploration de données à partir d'un fichier CSV.
Le but de la classification est de prédire si le client souscrira (1/0) à un dépôt à terme.
import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt
plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split
import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))
Suivez ces étapes pour implémenter le code ci-dessus dans Anaconda Navigator avec «Jupyter Notebook» -
Step 1 - Lancez le notebook Jupyter avec Anaconda Navigator.
Step 2 - Téléchargez le fichier csv pour obtenir la sortie du modèle de régression de manière systématique.
Step 3 - Créez un nouveau fichier et exécutez la ligne de code mentionnée ci-dessus pour obtenir la sortie souhaitée.