Weka - загрузка данных
В этой главе мы начнем с первой вкладки, которую вы используете для предварительной обработки данных. Это общее для всех алгоритмов, которые вы применили бы к своим данным для построения модели, и является общим шагом для всех последующих операций в WEKA.
Чтобы алгоритм машинного обучения давал приемлемую точность, важно, чтобы вы сначала очистили свои данные. Это связано с тем, что необработанные данные, собранные из поля, могут содержать нулевые значения, нерелевантные столбцы и так далее.
В этой главе вы узнаете, как предварительно обработать необработанные данные и создать чистый, содержательный набор данных для дальнейшего использования.
Сначала вы научитесь загружать файл данных в проводник WEKA. Данные могут быть загружены из следующих источников -
- Локальная файловая система
- Web
- Database
В этой главе мы подробно рассмотрим все три варианта загрузки данных.
Загрузка данных из локальной файловой системы
Сразу под вкладками машинного обучения, которые вы изучали на предыдущем уроке, вы найдете следующие три кнопки:
- Открыть файл ...
- Открыть URL ...
- Открыть БД ...
Нажми на Open file... кнопка. Откроется окно навигатора каталогов, как показано на следующем экране -
Теперь перейдите в папку, в которой хранятся ваши файлы данных. Установка WEKA включает в себя множество примеров баз данных для экспериментов. Они доступны вdata папка установки WEKA.
Для обучения выберите любой файл данных из этой папки. Содержимое файла будет загружено в среду WEKA. Очень скоро мы узнаем, как проверять и обрабатывать эти загруженные данные. Перед этим давайте посмотрим, как загрузить файл данных из Интернета.
Загрузка данных из Интернета
Как только вы нажмете на Open URL ... кнопку, вы можете увидеть следующее окно -
Мы откроем файл с общедоступного URL-адреса. Введите следующий URL-адрес во всплывающем окне -
https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff
Вы можете указать любой другой URL, где хранятся ваши данные. ВExplorer загрузит данные с удаленного сайта в свою среду.
Загрузка данных из БД
Как только вы нажмете на Open DB ..., вы можете увидеть следующее окно -
Установите строку подключения к своей базе данных, настройте запрос на выбор данных, обработайте запрос и загрузите выбранные записи в WEKA.