Was ist Weka?
WEKA - eine Open-Source-Software bietet Tools für die Datenvorverarbeitung, die Implementierung mehrerer Algorithmen für maschinelles Lernen und Visualisierungstools, mit denen Sie Techniken für maschinelles Lernen entwickeln und auf reale Data Mining-Probleme anwenden können. Was WEKA anbietet, ist in der folgenden Abbildung zusammengefasst:
Wenn Sie den Beginn des Bildflusses beobachten, werden Sie verstehen, dass es viele Phasen im Umgang mit Big Data gibt, um es für maschinelles Lernen geeignet zu machen -
Zunächst beginnen Sie mit den aus dem Feld gesammelten Rohdaten. Diese Daten können mehrere Nullwerte und irrelevante Felder enthalten. Sie verwenden die in WEKA bereitgestellten Datenvorverarbeitungstools, um die Daten zu bereinigen.
Anschließend würden Sie die vorverarbeiteten Daten in Ihrem lokalen Speicher speichern, um ML-Algorithmen anzuwenden.
Abhängig von der Art des ML-Modells, das Sie entwickeln möchten, wählen Sie als Nächstes eine der folgenden Optionen aus: Classify, Cluster, oder Associate. DasAttributes Selection ermöglicht die automatische Auswahl von Features, um einen reduzierten Datensatz zu erstellen.
Beachten Sie, dass WEKA unter jeder Kategorie die Implementierung mehrerer Algorithmen bereitstellt. Sie würden einen Algorithmus Ihrer Wahl auswählen, die gewünschten Parameter einstellen und ihn im Datensatz ausführen.
Dann würde WEKA Ihnen die statistische Ausgabe der Modellverarbeitung geben. Es bietet Ihnen ein Visualisierungstool zur Überprüfung der Daten.
Die verschiedenen Modelle können auf denselben Datensatz angewendet werden. Sie können dann die Ergebnisse verschiedener Modelle vergleichen und das Beste auswählen, das Ihrem Zweck entspricht.
Der Einsatz von WEKA führt somit zu einer schnelleren Entwicklung von Modellen für maschinelles Lernen insgesamt.
Nachdem wir gesehen haben, was WEKA ist und was es tut, lernen wir im nächsten Kapitel, wie Sie WEKA auf Ihrem lokalen Computer installieren.