Scikit Learn - Destek Vektör Makineleri

Bu bölüm, Destek Vektör Makineleri (SVM'ler) olarak adlandırılan bir makine öğrenimi yöntemiyle ilgilidir.

Giriş

Destek vektör makineleri (SVM'ler), sınıflandırma, regresyon ve aykırı değerlerin tespiti için kullanılan güçlü ancak esnek, denetlenen makine öğrenme yöntemleridir. SVM'ler yüksek boyutlu uzaylarda çok verimlidir ve genellikle sınıflandırma problemlerinde kullanılır. SVM'ler popülerdir ve hafıza açısından verimlidir çünkü karar işlevinde bir dizi eğitim noktası kullanırlar.

SVM'lerin temel amacı, bir veri setini bulmak için veri setlerini sınıfa bölmektir. maximum marginal hyperplane (MMH) bu, aşağıdaki iki adımda yapılabilir -

  • Destek Vektör Makineleri, önce sınıfları en iyi şekilde ayıran yinelemeli olarak hiper düzlemler üretecektir.

  • Bundan sonra, sınıfları doğru şekilde ayıran hiper düzlemi seçecektir.

SVM'deki bazı önemli kavramlar aşağıdaki gibidir -

  • Support Vectors- Hiper düzleme en yakın olan veri noktaları olarak tanımlanabilirler. Destek vektörleri, ayırma çizgisine karar vermede yardımcı olur.

  • Hyperplane - Farklı sınıflara sahip nesneler kümesini bölen karar düzlemi veya uzay.

  • Margin - Farklı sınıfların en yakın veri noktaları üzerindeki iki satır arasındaki boşluğa marj denir.

Aşağıdaki diyagramlar size bu SVM kavramları hakkında fikir verecektir -

Scikit-learn'deki SVM, girdi olarak hem seyrek hem de yoğun örnek vektörlerini destekler.

SVM'nin sınıflandırılması

Scikit-learn üç sınıf sağlar: SVC, NuSVC ve LinearSVC çok sınıflı sınıflandırma gerçekleştirebilen.

SVC

Uygulanması temel alınan C-destek vektör sınıflandırmasıdır. libsvm. Scikit-learn tarafından kullanılan modülsklearn.svm.SVC. Bu sınıf, çoklu sınıf desteğini bire bir şemaya göre ele alır.

Parametreler

Aşağıdaki tablo, sklearn.svm.SVC sınıf -

Sr.No Parametre ve Açıklama
1

C - float, isteğe bağlı, varsayılan = 1.0

Hata teriminin ceza parametresidir.

2

kernel - dize, isteğe bağlı, varsayılan = 'rbf'

Bu parametre, algoritmada kullanılacak çekirdek türünü belirtir. aralarından herhangi birini seçebiliriz‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’. Çekirdeğin varsayılan değeri şöyle olacaktır:‘rbf’.

3

degree - int, isteğe bağlı, varsayılan = 3

"Poli" çekirdek işlevinin derecesini temsil eder ve diğer tüm çekirdekler tarafından göz ardı edilir.

4

gamma - {'ölçek', 'otomatik'} veya kayan,

'Rbf', 'poli' ve 'sigmoid' çekirdeklerinin çekirdek katsayısıdır.

5

optinal default - = 'ölçek'

Varsayılanı, yani gama = 'ölçek' seçerseniz, SVC tarafından kullanılacak gama değeri 1 / (_ ∗. ()) Olur.

Öte yandan, gamma = 'auto' ise, 1 / _ kullanır.

6

coef0 - float, isteğe bağlı, Varsayılan = 0.0

Çekirdek işlevinde, yalnızca 'poli' ve 'sigmoid'de anlamlı olan bağımsız bir terim.

7

tol - float, isteğe bağlı, varsayılan = 1.e-3

Bu parametre, yinelemeler için durdurma kriterini temsil eder.

8

shrinking - Boolean, isteğe bağlı, varsayılan = Doğru

Bu parametre, küçültme buluşsal yöntemini kullanmak isteyip istemediğimizi gösterir.

9

verbose - Boolean, varsayılan: yanlış

Ayrıntılı çıktıyı etkinleştirir veya devre dışı bırakır. Varsayılan değeri yanlıştır.

10

probability - boole, isteğe bağlı, varsayılan = doğru

Bu parametre olasılık tahminlerini etkinleştirir veya devre dışı bırakır. Varsayılan değer yanlıştır, ancak uyum çağrılmadan önce etkinleştirilmesi gerekir.

11

max_iter - int, isteğe bağlı, varsayılan = -1

Adından da anlaşılacağı gibi, çözücü içindeki maksimum yineleme sayısını temsil eder. Değeri -1, yineleme sayısında sınır olmadığı anlamına gelir.

12

cache_size - şamandıra, isteğe bağlı

Bu parametre, çekirdek önbelleğinin boyutunu belirleyecektir. Değer MB (MegaByte) cinsinden olacaktır.

13

random_state - int, RandomState örneği veya Yok, isteğe bağlı, varsayılan = yok

Bu parametre, verileri karıştırırken kullanılan sözde rastgele sayının tohumunu temsil eder. Seçenekler şunlardır -

  • int- Bu durumda, random_state , rastgele sayı oluşturucu tarafından kullanılan tohumdur.

  • RandomState instance - Bu durumda, random_state, rastgele sayı üretecidir.

  • None - Bu durumda, rastgele sayı oluşturucu, np.random tarafından kullanılan RandonState örneğidir.

14

class_weight - {dict, 'dengeli'}, isteğe bağlı

Bu parametre, j sınıfının C parametresini SVC için _ℎ [] ∗ olarak ayarlayacaktır. Varsayılan seçeneği kullanırsak, bu tüm sınıfların bir ağırlığa sahip olması gerektiği anlamına gelir. Öte yandan, seçersenizclass_weight:balanced, ağırlıkları otomatik olarak ayarlamak için y'nin değerlerini kullanacaktır.

15

decision_function_shape - ovo ',' ovr ', varsayılan =' ovr '

Bu parametre, algoritmanın dönüp dönmeyeceğine karar verecektir ‘ovr’ Diğer tüm sınıflandırıcılar gibi şeklin (bir-dinlenme) karar fonksiyonu veya orijinal ovolibsvm'nin (bire bir) karar fonksiyonu.

16

break_ties - boole, isteğe bağlı, varsayılan = yanlış

True - Tahmin, karar_fonksiyonunun güven değerlerine göre bağları koparacaktır

False - Tahmin, berabere kalan sınıflar arasında birinci sınıfı döndürecektir.

Öznitellikler

Aşağıdaki tablo, tarafından kullanılan öznitelikleri içerir sklearn.svm.SVC sınıf -

Sr.No Öznitelikler ve Açıklama
1

support_ - dizi benzeri, şekil = [n_SV]

Destek vektörlerinin endekslerini döndürür.

2

support_vectors_ - dizi benzeri, şekil = [n_SV, n_features]

Destek vektörlerini döndürür.

3

n_support_ - dizi benzeri, dtype = int32, şekil = [n_sınıf]

Her bir sınıf için destek vektörlerinin sayısını temsil eder.

4

dual_coef_ - dizi, şekil = [n_sınıf-1, n_SV]

Bunlar, karar fonksiyonundaki destek vektörlerinin katsayısıdır.

5

coef_ - dizi, şekil = [n_sınıf * (n_sınıf-1) / 2, n_features]

Yalnızca doğrusal çekirdek durumunda mevcut olan bu özellik, özelliklere atanan ağırlığı sağlar.

6

intercept_ - dizi, şekil = [n_sınıf * (n_sınıf-1) / 2]

Karar fonksiyonundaki bağımsız terimi (sabit) temsil eder.

7

fit_status_ - int

Doğru şekilde takılırsa çıkış 0 olur. Yanlış takılırsa çıkış 1 olacaktır.

8

classes_ - şekil dizisi = [n_class]

Sınıfların etiketlerini verir.

Implementation Example

Diğer sınıflandırıcılar gibi, SVC de aşağıdaki iki diziyle donatılmalıdır -

  • Bir dizi Xeğitim örneklerini tutmak. [N_samples, n_features] boyutundadır.

  • Bir dizi Yhedef değerleri tutmak, yani eğitim örnekleri için sınıf etiketleri. [N_samples] boyutunda.

Python komut dosyası kullanımlarının ardından sklearn.svm.SVC sınıf -

import numpy as np
X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]])
y = np.array([1, 1, 2, 2])
from sklearn.svm import SVC
SVCClf = SVC(kernel = 'linear',gamma = 'scale', shrinking = False,)
SVCClf.fit(X, y)

Output

SVC(C = 1.0, cache_size = 200, class_weight = None, coef0 = 0.0,
   decision_function_shape = 'ovr', degree = 3, gamma = 'scale', kernel = 'linear',
   max_iter = -1, probability = False, random_state = None, shrinking = False,
   tol = 0.001, verbose = False)

Example

Şimdi, bir kez takıldıktan sonra ağırlık vektörünü aşağıdaki python betiğinin yardımıyla elde edebiliriz -

SVCClf.coef_

Output

array([[0.5, 0.5]])

Example

Benzer şekilde, diğer özniteliklerin değerini de şu şekilde alabiliriz -

SVCClf.predict([[-0.5,-0.8]])

Output

array([1])

Example

SVCClf.n_support_

Output

array([1, 1])

Example

SVCClf.support_vectors_

Output

array(
   [
      [-1., -1.],
      [ 1., 1.]
   ]
)

Example

SVCClf.support_

Output

array([0, 2])

Example

SVCClf.intercept_

Output

array([-0.])

Example

SVCClf.fit_status_

Output

0

NuSVC

NuSVC, Nu Destek Vektörü Sınıflandırmasıdır. Scikit-learn tarafından sağlanan, çok sınıflı sınıflandırma yapabilen başka bir sınıftır. SVC'ye benzer, ancak NuSVC biraz farklı parametre kümelerini kabul eder. SVC'den farklı olan parametre aşağıdaki gibidir -

  • nu - kayan nokta, isteğe bağlı, varsayılan = 0,5

Eğitim hatalarının fraksiyonunda bir üst sınırı ve destek vektörlerinin fraksiyonunun alt sınırını temsil eder. Değeri (o, 1] aralığında olmalıdır.

Parametrelerin ve özniteliklerin geri kalanı SVC ile aynıdır.

Uygulama Örneği

Aynı örneği kullanarak uygulayabiliriz sklearn.svm.NuSVC sınıf da.

import numpy as np
X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]])
y = np.array([1, 1, 2, 2])
from sklearn.svm import NuSVC
NuSVCClf = NuSVC(kernel = 'linear',gamma = 'scale', shrinking = False,)
NuSVCClf.fit(X, y)

Çıktı

NuSVC(cache_size = 200, class_weight = None, coef0 = 0.0,
   decision_function_shape = 'ovr', degree = 3, gamma = 'scale', kernel = 'linear',
   max_iter = -1, nu = 0.5, probability = False, random_state = None,
   shrinking = False, tol = 0.001, verbose = False)

SVC durumunda olduğu gibi, özniteliklerin geri kalanının çıktılarını alabiliriz.

DoğrusalSVC

Doğrusal Destek Vektörü Sınıflandırmasıdır. Kernel = 'lineer' olan SVC'ye benzer. Aralarındaki fark şudur:LinearSVC SVC, liblinear açısından uygulanırken libsvm. Nedeni buLinearSVCceza ve zarar fonksiyonlarının seçiminde daha fazla esnekliğe sahiptir. Aynı zamanda çok sayıda numuneye daha iyi ölçeklenir.

Parametreleri ve nitelikleri hakkında konuşursak, o zaman desteklemiyor ‘kernel’ çünkü doğrusal olduğu varsayılır ve aynı zamanda bazı özniteliklerden yoksundur. support_, support_vectors_, n_support_, fit_status_ ve, dual_coef_.

Ancak destekler penalty ve loss aşağıdaki gibi parametreler -

  • penalty − string, L1 or L2(default = ‘L2’)

    Bu parametre, cezalandırmada (düzenlenme) kullanılan normu (L1 veya L2) belirtmek için kullanılır.

  • loss − string, hinge, squared_hinge (default = squared_hinge)

    "Menteşe" nin standart SVM kaybı ve "kare menteşe" nin menteşe kaybının karesi olduğu kayıp fonksiyonunu temsil eder.

Uygulama Örneği

Python komut dosyası kullanımlarının ardından sklearn.svm.LinearSVC sınıf -

from sklearn.svm import LinearSVC
from sklearn.datasets import make_classification
X, y = make_classification(n_features = 4, random_state = 0)
LSVCClf = LinearSVC(dual = False, random_state = 0, penalty = 'l1',tol = 1e-5)
LSVCClf.fit(X, y)

Çıktı

LinearSVC(C = 1.0, class_weight = None, dual = False, fit_intercept = True,
   intercept_scaling = 1, loss = 'squared_hinge', max_iter = 1000,
   multi_class = 'ovr', penalty = 'l1', random_state = 0, tol = 1e-05, verbose = 0)

Misal

Şimdi, bir kez takıldığında model yeni değerleri şu şekilde tahmin edebilir -

LSVCClf.predict([[0,0,0,0]])

Çıktı

[1]

Misal

Yukarıdaki örnek için, aşağıdaki python betiğinin yardımıyla ağırlık vektörünü elde edebiliriz -

LSVCClf.coef_

Çıktı

[[0. 0. 0.91214955 0.22630686]]

Misal

Benzer şekilde, aşağıdaki python betiğinin yardımıyla kesişimin değerini alabiliriz -

LSVCClf.intercept_

Çıktı

[0.26860518]

SVM ile Regresyon

Daha önce tartışıldığı gibi, SVM hem sınıflandırma hem de regresyon problemleri için kullanılır. Scikit-learn'ün Destek Vektör Sınıflandırması (SVC) yöntemi, regresyon problemlerini çözmek için genişletilebilir. Bu genişletilmiş yönteme Destek Vektör Regresyonu (SVR) denir.

SVM ve SVR arasındaki temel benzerlik

SVC tarafından oluşturulan model, yalnızca eğitim verilerinin bir alt kümesine bağlıdır. Neden? Çünkü modeli oluşturmak için maliyet fonksiyonu, marjın dışında kalan eğitim veri noktalarını umursamıyor.

Oysa SVR (Destek Vektör Regresyonu) tarafından üretilen model de eğitim verilerinin yalnızca bir alt kümesine bağlıdır. Neden? Çünkü modeli oluşturmak için maliyet fonksiyonu, model tahminine yakın her türlü eğitim veri noktasını göz ardı eder.

Scikit-learn üç sınıf sağlar: SVR, NuSVR and LinearSVR SVR'nin üç farklı uygulaması olarak.

SVR

Uygulanması temel alınan Epsilon destekli vektör regresyonudur. libsvm. Tersi olarakSVC Modelde iki serbest parametre vardır: ‘C’ ve ‘epsilon’.

  • epsilon - float, isteğe bağlı, varsayılan = 0.1

Epsilon-SVR modelindeki epsilonu temsil eder ve gerçek değerden epsilon mesafesi içinde tahmin edilen noktalarla eğitim kaybı fonksiyonunda hiçbir cezanın ilişkilendirilmediği epsilon tüpünü belirtir.

Parametrelerin ve özniteliklerin geri kalanı, kullandığımız gibi benzer SVC.

Uygulama Örneği

Python komut dosyası kullanımlarının ardından sklearn.svm.SVR sınıf -

from sklearn import svm
X = [[1, 1], [2, 2]]
y = [1, 2]
SVRReg = svm.SVR(kernel = ’linear’, gamma = ’auto’)
SVRReg.fit(X, y)

Çıktı

SVR(C = 1.0, cache_size = 200, coef0 = 0.0, degree = 3, epsilon = 0.1, gamma = 'auto',
   kernel = 'linear', max_iter = -1, shrinking = True, tol = 0.001, verbose = False)

Misal

Şimdi, bir kez takıldıktan sonra ağırlık vektörünü aşağıdaki python betiğinin yardımıyla elde edebiliriz -

SVRReg.coef_

Çıktı

array([[0.4, 0.4]])

Misal

Benzer şekilde, diğer özniteliklerin değerini de şu şekilde alabiliriz -

SVRReg.predict([[1,1]])

Çıktı

array([1.1])

Benzer şekilde, diğer özelliklerin değerlerini de alabiliriz.

NuSVR

NuSVR, Nu Destek Vektörü Regresyonudur. NuSVC gibidir, ancak NuSVR bir parametre kullanırnudestek vektörlerinin sayısını kontrol etmek için. Ve dahası, NuSVC'nin aksinenu C parametresini değiştirdi, burada değiştirilir epsilon.

Uygulama Örneği

Python komut dosyası kullanımlarının ardından sklearn.svm.SVR sınıf -

from sklearn.svm import NuSVR
import numpy as np
n_samples, n_features = 20, 15
np.random.seed(0)
y = np.random.randn(n_samples)
X = np.random.randn(n_samples, n_features)
NuSVRReg = NuSVR(kernel = 'linear', gamma = 'auto',C = 1.0, nu = 0.1)^M
NuSVRReg.fit(X, y)

Çıktı

NuSVR(C = 1.0, cache_size = 200, coef0 = 0.0, degree = 3, gamma = 'auto',
   kernel = 'linear', max_iter = -1, nu = 0.1, shrinking = True, tol = 0.001,
   verbose = False)

Misal

Şimdi, bir kez takıldıktan sonra ağırlık vektörünü aşağıdaki python betiğinin yardımıyla elde edebiliriz -

NuSVRReg.coef_

Çıktı

array(
   [
      [-0.14904483, 0.04596145, 0.22605216, -0.08125403, 0.06564533,
      0.01104285, 0.04068767, 0.2918337 , -0.13473211, 0.36006765,
      -0.2185713 , -0.31836476, -0.03048429, 0.16102126, -0.29317051]
   ]
)

Benzer şekilde, diğer özelliklerin değerini de alabiliriz.

DoğrusalSVR

Doğrusal Destek Vektörü Regresyonudur. Çekirdek = 'doğrusal' olan SVR'ye benzer. Aralarındaki fark şudur:LinearSVR açısından uygulandı liblinearSVC, libsvm. Nedeni buLinearSVRceza ve zarar fonksiyonlarının seçiminde daha fazla esnekliğe sahiptir. Aynı zamanda çok sayıda numuneye daha iyi ölçeklenir.

Parametreleri ve nitelikleri hakkında konuşursak, o zaman desteklemiyor ‘kernel’ çünkü doğrusal olduğu varsayılır ve aynı zamanda bazı özniteliklerden yoksundur. support_, support_vectors_, n_support_, fit_status_ ve, dual_coef_.

Ancak, aşağıdaki gibi 'kayıp' parametrelerini destekler -

  • loss - string, isteğe bağlı, varsayılan = 'epsilon_insensitive'

Epsilon_insensitive kaybının L1 kaybı ve epsilon duyarlılığının karesinin L2 kaybı olduğu kayıp fonksiyonunu temsil eder.

Uygulama Örneği

Python komut dosyası kullanımlarının ardından sklearn.svm.LinearSVR sınıf -

from sklearn.svm import LinearSVR
from sklearn.datasets import make_regression
X, y = make_regression(n_features = 4, random_state = 0)
LSVRReg = LinearSVR(dual = False, random_state = 0,
loss = 'squared_epsilon_insensitive',tol = 1e-5)
LSVRReg.fit(X, y)

Çıktı

LinearSVR(
   C=1.0, dual=False, epsilon=0.0, fit_intercept=True,
   intercept_scaling=1.0, loss='squared_epsilon_insensitive',
   max_iter=1000, random_state=0, tol=1e-05, verbose=0
)

Misal

Şimdi, bir kez takıldığında model yeni değerleri şu şekilde tahmin edebilir -

LSRReg.predict([[0,0,0,0]])

Çıktı

array([-0.01041416])

Misal

Yukarıdaki örnek için, aşağıdaki python betiğinin yardımıyla ağırlık vektörünü elde edebiliriz -

LSRReg.coef_

Çıktı

array([20.47354746, 34.08619401, 67.23189022, 87.47017787])

Misal

Benzer şekilde, aşağıdaki python betiğinin yardımıyla kesişimin değerini alabiliriz -

LSRReg.intercept_

Çıktı

array([-0.01041416])