Logistische Regression in Python - Zusammenfassung
Die logistische Regression ist eine statistische Technik der binären Klassifizierung. In diesem Lernprogramm haben Sie gelernt, wie Sie die Maschine für die Verwendung der logistischen Regression trainieren. Die wichtigste Voraussetzung für die Erstellung von Modellen für maschinelles Lernen ist die Verfügbarkeit der Daten. Ohne angemessene und relevante Daten können Sie die Maschine nicht einfach zum Lernen bringen.
Sobald Sie Daten haben, besteht Ihre nächste Hauptaufgabe darin, die Daten zu bereinigen, unerwünschte Zeilen und Felder zu entfernen und die entsprechenden Felder für Ihre Modellentwicklung auszuwählen. Danach müssen Sie die Daten in ein Format abbilden, das der Klassifizierer für sein Training benötigt. Daher ist die Datenaufbereitung eine Hauptaufgabe in jeder maschinellen Lernanwendung. Sobald Sie mit den Daten fertig sind, können Sie einen bestimmten Klassifizierertyp auswählen.
In diesem Lernprogramm haben Sie gelernt, wie Sie einen in der sklearnBibliothek. Um den Klassifikator zu trainieren, verwenden wir ungefähr 70% der Daten zum Trainieren des Modells. Wir verwenden den Rest der Daten zum Testen. Wir testen die Genauigkeit des Modells. Wenn dies nicht innerhalb akzeptabler Grenzen liegt, kehren wir zur Auswahl der neuen Funktionen zurück.
Verfolgen Sie erneut den gesamten Prozess der Datenaufbereitung, trainieren Sie das Modell und testen Sie es, bis Sie mit seiner Genauigkeit zufrieden sind. Bevor Sie ein maschinelles Lernprojekt aufnehmen, müssen Sie eine Vielzahl von Techniken erlernen und kennenlernen, die bisher entwickelt und in der Branche erfolgreich angewendet wurden.