C का समर्थन वेक्टर मशीन के पूर्वाग्रह और विचरण पर क्या प्रभाव पड़ता है?

Aug 16 2020

एसवीएम के लिए न्यूनतम समस्या के रूप में लिखा जा सकता है- $$\overset{\text{min}}{\theta} C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]} + \frac12\sum_{j = 1}^n{\theta_j}^2$$

अब, कैसे की पसंद कर सकते हैं $C$ अंडरफुटिंग या ओवरफिटिंग के लिए नेतृत्व?

जैसा कि मैं समझता हूं, पैरामीटर बनाने के लिए चुने जाते हैं $C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]}$ अंश $0$। और हम खुद को दूसरे भाग के साथ चिंता करते हैं।

और एंड्रयू एनजी कहते हैं कि एक बड़ा$C$ निम्न पूर्वाग्रह और उच्च विचरण की ओर जाता है।

यह कैसे होता है? इसके पीछे क्या अंतर्ज्ञान है?

जवाब

4 prashant0598 Aug 16 2020 at 15:56

सी एक नियमित पैरामीटर है, यह नियंत्रित करता है कि आप किसी दिए गए वक्र के लिए प्रत्येक मिसकॉलिफ़ाइड बिंदु के लिए अपने मॉडल को कितना दंडित करना चाहते हैं।

यदि आप C को बड़ा मान देते हैं तो यह त्रुटियों को कम करने की कोशिश करेगा लेकिन साथ ही ऐसा हो सकता है कि यह परीक्षण डेटासेट पर बेहतर प्रदर्शन न करे इसलिए ओवरफिटिंग का कारण बनता है।

Svm में C के प्रभाव के बारे में अधिक जानने के लिए। देखें इस ।