Weka - บทนำ

รากฐานของแอปพลิเคชัน Machine Learning คือข้อมูลไม่ใช่แค่ข้อมูลเล็กน้อย แต่เป็นข้อมูลขนาดใหญ่ที่เรียกว่า Big Data ในคำศัพท์ปัจจุบัน

ในการฝึกอบรมเครื่องเพื่อวิเคราะห์ข้อมูลขนาดใหญ่คุณต้องมีข้อพิจารณาหลายประการเกี่ยวกับข้อมูล -

  • ข้อมูลต้องสะอาด
  • ไม่ควรมีค่าว่าง

นอกจากนี้ไม่ใช่ทุกคอลัมน์ในตารางข้อมูลที่จะมีประโยชน์สำหรับประเภทของการวิเคราะห์ที่คุณพยายามบรรลุ คอลัมน์ข้อมูลที่ไม่เกี่ยวข้องหรือ 'คุณลักษณะ' ตามที่เรียกในคำศัพท์ของ Machine Learning จะต้องถูกลบออกก่อนที่ข้อมูลจะถูกป้อนเข้าสู่อัลกอริทึมการเรียนรู้ของเครื่อง

กล่าวโดยสรุปข้อมูลขนาดใหญ่ของคุณจำเป็นต้องมีการประมวลผลล่วงหน้าจำนวนมากก่อนจึงจะสามารถใช้กับ Machine Learning ได้ เมื่อข้อมูลพร้อมแล้วคุณจะใช้อัลกอริทึม Machine Learning ต่างๆเช่นการจัดหมวดหมู่การถดถอยการจัดกลุ่มและอื่น ๆ เพื่อแก้ปัญหาในตอนท้ายของคุณ

ประเภทของอัลกอริทึมที่คุณใช้นั้นขึ้นอยู่กับความรู้เกี่ยวกับโดเมนของคุณเป็นส่วนใหญ่ แม้จะอยู่ในประเภทเดียวกันตัวอย่างเช่นการจัดประเภทก็มีอัลกอริทึมหลายแบบ คุณอาจต้องการทดสอบอัลกอริทึมต่างๆภายใต้คลาสเดียวกันเพื่อสร้างโมเดลแมชชีนเลิร์นนิงที่มีประสิทธิภาพ ในขณะที่ทำเช่นนั้นคุณต้องการการแสดงภาพข้อมูลที่ประมวลผลดังนั้นคุณจึงต้องใช้เครื่องมือแสดงภาพด้วย

ในบทต่อ ๆ ไปคุณจะได้เรียนรู้เกี่ยวกับ Weka ซึ่งเป็นซอฟต์แวร์ที่ช่วยให้คุณทำงานกับข้อมูลขนาดใหญ่ได้อย่างสะดวกสบาย