C का समर्थन वेक्टर मशीन के पूर्वाग्रह और विचरण पर क्या प्रभाव पड़ता है?
एसवीएम के लिए न्यूनतम समस्या के रूप में लिखा जा सकता है- $$\overset{\text{min}}{\theta} C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]} + \frac12\sum_{j = 1}^n{\theta_j}^2$$
अब, कैसे की पसंद कर सकते हैं $C$ अंडरफुटिंग या ओवरफिटिंग के लिए नेतृत्व?
जैसा कि मैं समझता हूं, पैरामीटर बनाने के लिए चुने जाते हैं $C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]}$ अंश $0$। और हम खुद को दूसरे भाग के साथ चिंता करते हैं।
और एंड्रयू एनजी कहते हैं कि एक बड़ा$C$ निम्न पूर्वाग्रह और उच्च विचरण की ओर जाता है।
यह कैसे होता है? इसके पीछे क्या अंतर्ज्ञान है?
जवाब
सी एक नियमित पैरामीटर है, यह नियंत्रित करता है कि आप किसी दिए गए वक्र के लिए प्रत्येक मिसकॉलिफ़ाइड बिंदु के लिए अपने मॉडल को कितना दंडित करना चाहते हैं।
यदि आप C को बड़ा मान देते हैं तो यह त्रुटियों को कम करने की कोशिश करेगा लेकिन साथ ही ऐसा हो सकता है कि यह परीक्षण डेटासेट पर बेहतर प्रदर्शन न करे इसलिए ओवरफिटिंग का कारण बनता है।
Svm में C के प्रभाव के बारे में अधिक जानने के लिए। देखें इस ।