การเรียนรู้ของเครื่อง - ได้รับการดูแล
การเรียนรู้ภายใต้การดูแลเป็นหนึ่งในรูปแบบสำคัญของการเรียนรู้ที่เกี่ยวข้องกับเครื่องฝึก บทนี้พูดถึงรายละเอียดเกี่ยวกับเรื่องเดียวกัน
อัลกอริทึมสำหรับการเรียนรู้ภายใต้การดูแล
มีหลายอัลกอริทึมสำหรับการเรียนรู้ภายใต้การดูแล อัลกอริทึมที่ใช้กันอย่างแพร่หลายของการเรียนรู้ภายใต้การดูแลมีดังต่อไปนี้ -
- k- เพื่อนบ้านที่ใกล้ที่สุด
- ต้นไม้แห่งการตัดสินใจ
- ไร้เดียงสา Bayes
- การถดถอยโลจิสติก
- สนับสนุนเครื่องเวกเตอร์
ในขณะที่เราดำเนินการต่อในบทนี้ให้เราพิจารณารายละเอียดเกี่ยวกับอัลกอริทึมแต่ละอย่าง
k- เพื่อนบ้านที่ใกล้ที่สุด
k-Nearest Neighbours ซึ่งเรียกง่ายๆว่า kNN เป็นเทคนิคทางสถิติที่สามารถใช้ในการแก้ปัญหาการจำแนกประเภทและการถดถอย ให้เราพูดถึงกรณีการจำแนกวัตถุที่ไม่รู้จักโดยใช้ kNN พิจารณาการกระจายของวัตถุตามที่แสดงในภาพด้านล่าง -
ที่มา:
https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
แผนภาพแสดงวัตถุสามประเภทโดยทำเครื่องหมายด้วยสีแดงสีน้ำเงินและสีเขียว เมื่อคุณเรียกใช้ตัวแยกประเภท kNN บนชุดข้อมูลข้างต้นขอบเขตของวัตถุแต่ละประเภทจะถูกทำเครื่องหมายดังที่แสดงด้านล่าง -
ที่มา:
https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
ตอนนี้ให้พิจารณาวัตถุใหม่ที่ไม่รู้จักซึ่งคุณต้องการจัดประเภทเป็นสีแดงสีเขียวหรือสีน้ำเงิน นี่คือภาพด้านล่าง
ดังที่คุณเห็นด้วยสายตาจุดข้อมูลที่ไม่รู้จักเป็นของคลาสของวัตถุสีน้ำเงิน ในทางคณิตศาสตร์สามารถสรุปได้โดยการวัดระยะห่างของจุดที่ไม่รู้จักนี้กับจุดอื่น ๆ ในชุดข้อมูล เมื่อคุณทำเช่นนั้นคุณจะรู้ว่าเพื่อนบ้านส่วนใหญ่เป็นสีฟ้า ระยะทางเฉลี่ยไปยังวัตถุสีแดงและสีเขียวจะมากกว่าระยะทางเฉลี่ยไปยังวัตถุสีน้ำเงินอย่างแน่นอน ดังนั้นวัตถุที่ไม่รู้จักนี้สามารถถูกจัดประเภทเป็นของคลาสสีน้ำเงิน
อัลกอริทึม kNN ยังสามารถใช้สำหรับปัญหาการถดถอย อัลกอริทึม kNN พร้อมใช้งานในไลบรารี ML ส่วนใหญ่
ต้นไม้แห่งการตัดสินใจ
แผนผังการตัดสินใจอย่างง่ายในรูปแบบผังงานแสดงไว้ด้านล่าง -
คุณจะต้องเขียนโค้ดเพื่อจำแนกข้อมูลอินพุตของคุณตามผังงานนี้ ผังงานสามารถอธิบายได้ด้วยตนเองและไม่สำคัญ ในสถานการณ์นี้คุณกำลังพยายามจัดประเภทอีเมลขาเข้าเพื่อตัดสินใจว่าจะอ่านเมื่อใด
ในความเป็นจริงต้นไม้แห่งการตัดสินใจอาจมีขนาดใหญ่และซับซ้อน มีอัลกอริทึมหลายอย่างเพื่อสร้างและสำรวจต้นไม้เหล่านี้ ในฐานะผู้ที่ชื่นชอบ Machine Learning คุณต้องเข้าใจและเชี่ยวชาญเทคนิคเหล่านี้ในการสร้างและสำรวจเส้นทางการตัดสินใจ
ไร้เดียงสา Bayes
Naive Bayes ใช้สำหรับสร้างลักษณนาม สมมติว่าคุณต้องการคัดแยก (แยกประเภท) ผลไม้ชนิดต่างๆจากตะกร้าผลไม้ คุณอาจใช้คุณสมบัติต่างๆเช่นสีขนาดและรูปร่างของผลไม้ตัวอย่างเช่นผลไม้ที่มีสีแดงมีลักษณะกลมและมีเส้นผ่านศูนย์กลางประมาณ 10 ซม. ดังนั้นในการฝึกโมเดลคุณจะต้องใช้คุณสมบัติเหล่านี้และทดสอบความน่าจะเป็นที่คุณสมบัติที่กำหนดนั้นตรงกับข้อ จำกัด ที่ต้องการ จากนั้นความน่าจะเป็นของคุณสมบัติต่างๆจะถูกรวมเข้าด้วยกันเพื่อให้ได้ความน่าจะเป็นที่ผลไม้ที่ให้มาคือแอปเปิ้ล โดยทั่วไปแล้ว Naive Bayes ต้องการข้อมูลการฝึกอบรมจำนวนเล็กน้อยสำหรับการจำแนกประเภท
การถดถอยโลจิสติก
ดูแผนภาพต่อไปนี้ แสดงการกระจายของจุดข้อมูลในระนาบ XY
จากแผนภาพเราสามารถตรวจสอบการแยกจุดสีแดงออกจากจุดสีเขียวได้ด้วยสายตา คุณอาจวาดเส้นแบ่งเขตเพื่อแยกจุดเหล่านี้ออก ตอนนี้ในการจัดประเภทจุดข้อมูลใหม่คุณจะต้องพิจารณาว่าจุดนั้นอยู่ที่ด้านใดของเส้น
สนับสนุนเครื่องเวกเตอร์
ดูการกระจายของข้อมูลต่อไปนี้ ในที่นี้ข้อมูลทั้งสามคลาสไม่สามารถแยกออกจากกันได้ เส้นโค้งขอบเขตไม่เป็นเส้นตรง ในกรณีเช่นนี้การหาสมการของเส้นโค้งจะกลายเป็นงานที่ซับซ้อน
ที่มา: http://uc-r.github.io/svm
Support Vector Machines (SVM) มีประโยชน์ในการกำหนดขอบเขตการแยกในสถานการณ์เช่นนี้