C มีผลต่ออคติและความแปรปรวนของ Support Vector Machine อย่างไร?

Aug 16 2020

ปัญหาการย่อขนาดสำหรับ SVM สามารถเขียนเป็น - $$\overset{\text{min}}{\theta} C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]} + \frac12\sum_{j = 1}^n{\theta_j}^2$$

ตอนนี้วิธีที่สามารถเลือก $C$ นำไปสู่การไม่เหมาะสมหรือสวมใส่มากเกินไป?

ตามที่ฉันเข้าใจพารามิเตอร์จะถูกเลือกให้ทำ $C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]}$ ส่วน $0$. และเรากังวลตัวเองกับส่วนที่สอง

และแอนดรูว์อึ้งว่าขนาดใหญ่$C$ นำไปสู่การลดอคติและความแปรปรวนที่สูงขึ้น

สิ่งนี้เกิดขึ้นได้อย่างไร? สัญชาตญาณเบื้องหลังสิ่งนี้คืออะไร?

คำตอบ

4 prashant0598 Aug 16 2020 at 15:56

C เป็นพารามิเตอร์ที่กำหนดให้เป็นประจำจะควบคุมว่าคุณต้องการลงโทษโมเดลของคุณมากแค่ไหนสำหรับแต่ละจุดที่จัดประเภทไม่ถูกต้องสำหรับเส้นโค้งที่กำหนด

หากคุณใส่ค่ามากให้กับ C มันจะพยายามลดข้อผิดพลาด แต่ในขณะเดียวกันก็อาจเกิดขึ้นได้ว่าชุดข้อมูลทดสอบจะทำงานได้ไม่ดีกว่าด้วยเหตุนี้จึงทำให้เกิดการติดตั้งมากเกินไป

หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับเอฟเฟกต์ของ C ใน svm อ้างถึงนี้