Weka - กำลังโหลดข้อมูล

ในบทนี้เราจะเริ่มต้นด้วยแท็บแรกที่คุณใช้เพื่อประมวลผลข้อมูลล่วงหน้า นี่เป็นเรื่องปกติสำหรับอัลกอริทึมทั้งหมดที่คุณจะนำไปใช้กับข้อมูลของคุณในการสร้างโมเดลและเป็นขั้นตอนทั่วไปสำหรับการดำเนินการที่ตามมาใน WEKA

เพื่อให้อัลกอริทึมการเรียนรู้ของเครื่องให้ความแม่นยำที่ยอมรับได้สิ่งสำคัญคือคุณต้องล้างข้อมูลของคุณก่อน เนื่องจากข้อมูลดิบที่รวบรวมจากฟิลด์อาจมีค่า null คอลัมน์ที่ไม่เกี่ยวข้องเป็นต้น

ในบทนี้คุณจะได้เรียนรู้วิธีประมวลผลข้อมูลดิบล่วงหน้าและสร้างชุดข้อมูลที่สะอาดและมีความหมายสำหรับการใช้งานต่อไป

ขั้นแรกคุณจะได้เรียนรู้การโหลดไฟล์ข้อมูลลงใน WEKA explorer ข้อมูลสามารถโหลดได้จากแหล่งต่อไปนี้ -

  • ระบบไฟล์ภายในเครื่อง
  • Web
  • Database

ในบทนี้เราจะเห็นตัวเลือกการโหลดข้อมูลทั้งหมดสามตัวเลือกโดยละเอียด

กำลังโหลดข้อมูลจาก Local File System

ใต้แท็บ Machine Learning ที่คุณศึกษาในบทเรียนก่อนหน้านี้คุณจะพบปุ่มสามปุ่มต่อไปนี้ -

  • เปิดไฟล์ ...
  • เปิด URL ...
  • เปิด DB ...

คลิกที่ Open fileปุ่ม ... หน้าต่างไดเร็กทอรีเนวิเกเตอร์จะเปิดขึ้นดังที่แสดงในหน้าจอต่อไปนี้ -

ตอนนี้ไปที่โฟลเดอร์ที่เก็บไฟล์ข้อมูลของคุณ การติดตั้ง WEKA มีฐานข้อมูลตัวอย่างมากมายให้คุณทดลอง สิ่งเหล่านี้มีอยู่ในไฟล์data โฟลเดอร์ของการติดตั้ง WEKA

เพื่อการเรียนรู้เลือกไฟล์ข้อมูลจากโฟลเดอร์นี้ เนื้อหาของไฟล์จะถูกโหลดในสภาพแวดล้อม WEKA เร็ว ๆ นี้เราจะเรียนรู้วิธีตรวจสอบและประมวลผลข้อมูลที่โหลดนี้ ก่อนหน้านั้นให้เราดูวิธีการโหลดไฟล์ข้อมูลจากเว็บ

กำลังโหลดข้อมูลจากเว็บ

เมื่อคุณคลิกที่ไฟล์ Open URL ... คุณจะเห็นหน้าต่างดังต่อไปนี้ -

เราจะเปิดไฟล์จาก URL สาธารณะพิมพ์ URL ต่อไปนี้ในกล่องป๊อปอัป -

https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff

คุณสามารถระบุ URL อื่นที่จัดเก็บข้อมูลของคุณ Explorer จะโหลดข้อมูลจากไซต์ระยะไกลเข้าสู่สภาพแวดล้อม

กำลังโหลดข้อมูลจาก DB

เมื่อคุณคลิกที่ไฟล์ Open DB ... คุณจะเห็นหน้าต่างดังต่อไปนี้ -

ตั้งค่าสตริงการเชื่อมต่อกับฐานข้อมูลของคุณตั้งค่าแบบสอบถามสำหรับการเลือกข้อมูลประมวลผลแบบสอบถามและโหลดระเบียนที่เลือกใน WEKA