การเรียนรู้ของเครื่องสำหรับการวิเคราะห์ข้อมูล
การเรียนรู้ของเครื่องเป็นสาขาย่อยของวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับงานต่างๆเช่นการจดจำรูปแบบการมองเห็นของคอมพิวเตอร์การรู้จำเสียงการวิเคราะห์ข้อความและมีการเชื่อมโยงที่ชัดเจนกับสถิติและการเพิ่มประสิทธิภาพทางคณิตศาสตร์ แอปพลิเคชั่นรวมถึงการพัฒนาเครื่องมือค้นหาการกรองสแปมการจดจำอักขระด้วยแสง (OCR) เป็นต้น ขอบเขตระหว่างการขุดข้อมูลการจดจำรูปแบบและสาขาการเรียนรู้ทางสถิติไม่ชัดเจนและโดยพื้นฐานแล้วทั้งหมดอ้างถึงปัญหาที่คล้ายคลึงกัน
การเรียนรู้ของเครื่องสามารถแบ่งออกเป็นสองประเภทของงาน -
- การเรียนรู้ภายใต้การดูแล
- การเรียนรู้ที่ไม่มีผู้ดูแล
การเรียนรู้ภายใต้การดูแล
การเรียนรู้ภายใต้การดูแลหมายถึงประเภทของปัญหาที่มีการป้อนข้อมูลกำหนดเป็นเมทริกซ์XและเรามีความสนใจในการทำนายการตอบสนองY ที่ไหนX = {x 1 , x 2 , ... , x n }มีnพยากรณ์และมีสองค่าการ y = {C 1ค2 }
ตัวอย่างแอปพลิเคชันคือการคาดการณ์ความเป็นไปได้ที่ผู้ใช้เว็บจะคลิกโฆษณาโดยใช้คุณลักษณะทางประชากรเป็นตัวทำนาย ซึ่งมักเรียกว่าเพื่อคาดคะเนอัตราการคลิกผ่าน (CTR) จากนั้นy = {click, don't - click}และตัวทำนายอาจเป็นที่อยู่ IP ที่ใช้, วันที่เขาเข้าสู่ไซต์, เมืองของผู้ใช้, ประเทศท่ามกลางคุณสมบัติอื่น ๆ ที่สามารถใช้ได้
การเรียนรู้ที่ไม่มีผู้ดูแล
การเรียนรู้ที่ไม่มีผู้ดูแลเกี่ยวข้องกับปัญหาในการค้นหากลุ่มที่มีความคล้ายคลึงกันโดยไม่มีชั้นเรียนให้เรียนรู้ มีหลายวิธีในการเรียนรู้การทำแผนที่จากตัวทำนายไปจนถึงการค้นหากลุ่มที่แชร์อินสแตนซ์ที่คล้ายกันในแต่ละกลุ่มและแตกต่างกัน
การประยุกต์ใช้ตัวอย่างของการเรียนรู้ที่ไม่มีผู้ดูแลคือการแบ่งกลุ่มลูกค้า ตัวอย่างเช่นในอุตสาหกรรมโทรคมนาคมงานทั่วไปคือการแบ่งกลุ่มผู้ใช้ตามการใช้งานที่ให้กับโทรศัพท์ ซึ่งจะช่วยให้ฝ่ายการตลาดกำหนดเป้าหมายแต่ละกลุ่มด้วยผลิตภัณฑ์ที่แตกต่างกัน