Erstellen eines Regressionsmodells
Die logistische Regression bezieht sich auf den Algorithmus für maschinelles Lernen, mit dem die Wahrscheinlichkeit einer kategorial abhängigen Variablen vorhergesagt wird. Bei der logistischen Regression ist die abhängige Variable eine binäre Variable, die aus Daten besteht, die als 1 codiert sind (Boolesche Werte von wahr und falsch).
In diesem Kapitel konzentrieren wir uns auf die Entwicklung eines Regressionsmodells in Python unter Verwendung einer kontinuierlichen Variablen. Das Beispiel für ein lineares Regressionsmodell konzentriert sich auf die Datenexploration aus einer CSV-Datei.
Das Klassifizierungsziel besteht darin, vorherzusagen, ob der Kunde eine Festgeldeinzahlung (1/0) abonnieren wird.
import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt
plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split
import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))
Befolgen Sie diese Schritte, um den obigen Code in Anaconda Navigator mit "Jupyter Notebook" zu implementieren -
Step 1 - Starten Sie das Jupyter Notebook mit Anaconda Navigator.
Step 2 - Laden Sie die CSV-Datei hoch, um die Ausgabe des Regressionsmodells systematisch abzurufen.
Step 3 - Erstellen Sie eine neue Datei und führen Sie die oben genannte Codezeile aus, um die gewünschte Ausgabe zu erhalten.