Weka - ładowanie danych

W tym rozdziale zaczynamy od pierwszej karty, której używasz do wstępnego przetwarzania danych. Jest to wspólne dla wszystkich algorytmów, które zastosowałbyś do swoich danych w celu zbudowania modelu i jest wspólnym krokiem dla wszystkich kolejnych operacji w WEKA.

Aby algorytm uczenia maszynowego zapewniał akceptowalną dokładność, ważne jest, aby najpierw wyczyścić dane. Dzieje się tak, ponieważ nieprzetworzone dane zebrane z pola mogą zawierać wartości null, nieistotne kolumny i tak dalej.

W tym rozdziale dowiesz się, jak wstępnie przetwarzać surowe dane i tworzyć czysty, zrozumiały zbiór danych do dalszego wykorzystania.

Najpierw nauczysz się ładować plik danych do eksploratora WEKA. Dane można załadować z następujących źródeł -

  • Lokalny system plików
  • Web
  • Database

W tym rozdziale omówimy szczegółowo wszystkie trzy opcje ładowania danych.

Ładowanie danych z lokalnego systemu plików

Tuż pod kartami uczenia maszynowego, które studiowałeś w poprzedniej lekcji, znajdziesz następujące trzy przyciski -

  • Otwórz plik ...
  • Otwórz URL ...
  • Otwórz bazę danych ...

Kliknij na Open file... przycisk. Otworzy się okno nawigatora katalogów, jak pokazano na poniższym ekranie -

Teraz przejdź do folderu, w którym przechowywane są pliki danych. Instalacja WEKA zawiera wiele przykładowych baz danych do eksperymentowania. Są one dostępne wdata folder instalacji WEKA.

W celach edukacyjnych wybierz dowolny plik danych z tego folderu. Zawartość pliku zostanie załadowana w środowisku WEKA. Wkrótce dowiemy się, jak sprawdzać i przetwarzać te załadowane dane. Wcześniej przyjrzyjmy się, jak załadować plik danych z Internetu.

Ładowanie danych z sieci

Po kliknięciu Open URL ... przycisk, możesz zobaczyć następujące okno -

Otworzymy plik z publicznego adresu URL Wpisz następujący adres URL w wyskakującym okienku -

https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff

Możesz podać dowolny inny adres URL, pod którym przechowywane są Twoje dane. PlikExplorer załaduje dane ze zdalnego miejsca do swojego środowiska.

Ładowanie danych z DB

Po kliknięciu Open DB ..., możesz zobaczyć następujące okno -

Ustaw parametry połączenia z bazą danych, skonfiguruj zapytanie o wybór danych, przetwórz zapytanie i załaduj wybrane rekordy do WEKA.