C'nin bir Destek Vektör Makinesinin sapması ve sapması üzerinde nasıl bir etkisi vardır?

Aug 16 2020

SVM için minimizasyon problemi şu şekilde yazılabilir: $$\overset{\text{min}}{\theta} C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]} + \frac12\sum_{j = 1}^n{\theta_j}^2$$

Şimdi, seçim nasıl olabilir? $C$ uyumsuzluğa mı yoksa gereğinden fazla takmaya mı yol açıyor?

Anladığım kadarıyla, yapılacak parametreler $C\sum_{i = 1}^{m}{[y^icost_1(\theta^Tx^i) + (1-y^i)cost_0(\theta^Tx^i)]}$ Bölüm $0$. Ve kendimizi ikinci bölümle ilgileniyoruz.

Ve Andrew Ng diyor ki,$C$ daha düşük önyargı ve daha yüksek varyansa yol açar.

Bu nasıl olur? Bunun arkasındaki sezgi nedir?

Yanıtlar

4 prashant0598 Aug 16 2020 at 15:56

Düzenlenmiş bir parametre olan C, belirli bir eğri için yanlış sınıflandırılmış her nokta için modelinizi ne kadar cezalandırmak istediğinizi kontrol eder.

C'ye büyük bir değer koyarsanız, hataları azaltmaya çalışır, ancak aynı zamanda test veri setinde daha iyi performans göstermeyebilir ve dolayısıyla aşırı uyuma neden olabilir.

C'nin svm'deki etkisi hakkında daha fazla bilgi edinmek için. Bakın bu .