CNTK - Lojistik Regresyon Modeli

Bu bölüm, CNTK'da bir lojistik regresyon modeli oluşturmayı ele almaktadır.

Lojistik Regresyon modelinin temelleri

En basit makine öğrenimi tekniklerinden biri olan Lojistik Regresyon, özellikle ikili sınıflandırma için bir tekniktir. Diğer bir deyişle, tahmin edilecek değişkenin değerinin sadece iki kategorik değerden biri olabileceği durumlarda bir tahmin modeli oluşturmak. Lojistik Regresyonun en basit örneklerinden biri, kişinin yaşına, sesine, kıllarına vb.

Misal

Lojistik Regresyon kavramını matematiksel olarak başka bir örnek yardımıyla anlayalım -

Diyelim ki, bir kredi başvurusunun kredi değerini tahmin etmek istiyoruz; 0, başvuru sahibine bağlı olarak reddetmek, 1 ise onaylamak anlamına gelirdebt , income ve credit rating. Borcu X1 ile, geliri X2 ile ve kredi notunu X3 ile temsil ediyoruz.

Lojistik Regresyonda, aşağıdakilerle temsil edilen bir ağırlık değeri belirleriz w, her özellik ve tek bir önyargı değeri için b.

Şimdi varsayalım,

X1 = 3.0
X2 = -2.0
X3 = 1.0

Ve ağırlığı ve önyargıyı aşağıdaki gibi belirlediğimizi varsayalım -

W1 = 0.65, W2 = 1.75, W3 = 2.05 and b = 0.33

Şimdi, sınıfı tahmin etmek için aşağıdaki formülü uygulamamız gerekiyor -

Z = (X1*W1)+(X2*W2)+(X3+W3)+b
i.e. Z = (3.0)*(0.65) + (-2.0)*(1.75) + (1.0)*(2.05) + 0.33
= 0.83

Sonra, hesaplamamız gerekiyor P = 1.0/(1.0 + exp(-Z)). Burada exp () işlevi Euler'in sayısıdır.

P = 1.0/(1.0 + exp(-0.83)
= 0.6963

P değeri, sınıfın 1 olma olasılığı olarak yorumlanabilir. P <0.5 ise, tahmin sınıf = 0, aksi takdirde tahmin (P> = 0.5) sınıf = 1'dir.

Ağırlık ve sapma değerlerini belirlemek için, bilinen girdi tahmin değerlerine ve bilinen doğru sınıf etiketi değerlerine sahip bir dizi eğitim verisi elde etmeliyiz. Bundan sonra, ağırlık ve sapma değerlerini bulmak için genellikle Gradient Descent algoritması kullanabiliriz.

LR modeli uygulama örneği

Bu LR modeli için aşağıdaki veri setini kullanacağız -

1.0, 2.0, 0
3.0, 4.0, 0
5.0, 2.0, 0
6.0, 3.0, 0
8.0, 1.0, 0
9.0, 2.0, 0
1.0, 4.0, 1
2.0, 5.0, 1
4.0, 6.0, 1
6.0, 5.0, 1
7.0, 3.0, 1
8.0, 5.0, 1

Bu LR modeli uygulamasını CNTK'da başlatmak için önce aşağıdaki paketleri içe aktarmamız gerekiyor -

import numpy as np
import cntk as C

Program aşağıdaki gibi main () işleviyle yapılandırılmıştır -

def main():
print("Using CNTK version = " + str(C.__version__) + "\n")

Şimdi, eğitim verilerini hafızaya aşağıdaki gibi yüklememiz gerekiyor -

data_file = ".\\dataLRmodel.txt"
print("Loading data from " + data_file + "\n")
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[0,1])
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[2], ndmin=2)

Şimdi, eğitim verileriyle uyumlu bir lojistik regresyon modeli oluşturan bir eğitim programı oluşturacağız -

features_dim = 2
labels_dim = 1
X = C.ops.input_variable(features_dim, np.float32)
y = C.input_variable(labels_dim, np.float32)
W = C.parameter(shape=(features_dim, 1)) # trainable cntk.Parameter
b = C.parameter(shape=(labels_dim))
z = C.times(X, W) + b
p = 1.0 / (1.0 + C.exp(-z))
model = p

Şimdi şu şekilde Lerner ve eğitmen oluşturmamız gerekiyor -

ce_error = C.binary_cross_entropy(model, y) # CE a bit more principled for LR
fixed_lr = 0.010
learner = C.sgd(model.parameters, fixed_lr)
trainer = C.Trainer(model, (ce_error), [learner])
max_iterations = 4000

LR Modeli eğitimi

LR modelini oluşturduktan sonra, şimdi eğitim sürecini başlatma zamanıdır -

np.random.seed(4)
N = len(features_mat)
for i in range(0, max_iterations):
row = np.random.choice(N,1) # pick a random row from training items
trainer.train_minibatch({ X: features_mat[row], y: labels_mat[row] })
if i % 1000 == 0 and i > 0:
mcee = trainer.previous_minibatch_loss_average
print(str(i) + " Cross-entropy error on curr item = %0.4f " % mcee)

Şimdi, aşağıdaki kodun yardımıyla model ağırlıklarını ve önyargılarını yazdırabiliriz -

np.set_printoptions(precision=4, suppress=True)
print("Model weights: ")
print(W.value)
print("Model bias:")
print(b.value)
print("")
if __name__ == "__main__":
main()

Lojistik Regresyon modeli eğitme - Tam örnek

import numpy as np
import cntk as C
   def main():
print("Using CNTK version = " + str(C.__version__) + "\n")
data_file = ".\\dataLRmodel.txt" # provide the name and the location of data file
print("Loading data from " + data_file + "\n")
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[0,1])
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[2], ndmin=2)
features_dim = 2
labels_dim = 1
X = C.ops.input_variable(features_dim, np.float32)
y = C.input_variable(labels_dim, np.float32)
W = C.parameter(shape=(features_dim, 1)) # trainable cntk.Parameter
b = C.parameter(shape=(labels_dim))
z = C.times(X, W) + b
p = 1.0 / (1.0 + C.exp(-z))
model = p
ce_error = C.binary_cross_entropy(model, y) # CE a bit more principled for LR
fixed_lr = 0.010
learner = C.sgd(model.parameters, fixed_lr)
trainer = C.Trainer(model, (ce_error), [learner])
max_iterations = 4000
np.random.seed(4)
N = len(features_mat)
for i in range(0, max_iterations):
row = np.random.choice(N,1) # pick a random row from training items
trainer.train_minibatch({ X: features_mat[row], y: labels_mat[row] })
if i % 1000 == 0 and i > 0:
mcee = trainer.previous_minibatch_loss_average
print(str(i) + " Cross-entropy error on curr item = %0.4f " % mcee)
np.set_printoptions(precision=4, suppress=True)
print("Model weights: ")
print(W.value)
print("Model bias:")
print(b.value)
if __name__ == "__main__":
  main()

Çıktı

Using CNTK version = 2.7
1000 cross entropy error on curr item = 0.1941
2000 cross entropy error on curr item = 0.1746
3000 cross entropy error on curr item = 0.0563
Model weights:
[-0.2049]
   [0.9666]]
Model bias:
[-2.2846]

Eğitimli LR Modeli kullanarak tahmin

LR modeli eğitildikten sonra, onu aşağıdaki gibi tahmin için kullanabiliriz -

Öncelikle, değerlendirme programımız numpy paketini içe aktarır ve eğitim verilerini yukarıda uyguladığımız eğitim programıyla aynı şekilde bir özellik matrisine ve bir sınıf etiketi matrisine yükler -

import numpy as np
def main():
data_file = ".\\dataLRmodel.txt" # provide the name and the location of data file
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=(0,1))
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=[2], ndmin=2)

Ardından, eğitim programımız tarafından belirlenen ağırlıkların ve önyargıların değerlerini ayarlama zamanı -

print("Setting weights and bias values \n")
weights = np.array([0.0925, 1.1722], dtype=np.float32)
bias = np.array([-4.5400], dtype=np.float32)
N = len(features_mat)
features_dim = 2

Daha sonra değerlendirme programımız, her bir eğitim öğesinin üzerinden aşağıdaki şekilde geçerek lojistik regresyon olasılığını hesaplayacaktır -

print("item pred_prob pred_label act_label result")
for i in range(0, N): # each item
   x = features_mat[i]
   z = 0.0
   for j in range(0, features_dim):
   z += x[j] * weights[j]
   z += bias[0]
   pred_prob = 1.0 / (1.0 + np.exp(-z))
  pred_label = 0 if pred_prob < 0.5 else 1
   act_label = labels_mat[i]
   pred_str = ‘correct’ if np.absolute(pred_label - act_label) < 1.0e-5 \
    else ‘WRONG’
  print("%2d %0.4f %0.0f %0.0f %s" % \ (i, pred_prob, pred_label, act_label, pred_str))

Şimdi nasıl tahmin yapılacağını gösterelim -

x = np.array([9.5, 4.5], dtype=np.float32)
print("\nPredicting class for age, education = ")
print(x)
z = 0.0
for j in range(0, features_dim):
z += x[j] * weights[j]
z += bias[0]
p = 1.0 / (1.0 + np.exp(-z))
print("Predicted p = " + str(p))
if p < 0.5: print("Predicted class = 0")
else: print("Predicted class = 1")

Tam tahmin değerlendirme programı

import numpy as np
def main():
data_file = ".\\dataLRmodel.txt" # provide the name and the location of data file
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=(0,1))
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=[2], ndmin=2)
print("Setting weights and bias values \n")
weights = np.array([0.0925, 1.1722], dtype=np.float32)
bias = np.array([-4.5400], dtype=np.float32)
N = len(features_mat)
features_dim = 2
print("item pred_prob pred_label act_label result")
for i in range(0, N): # each item
   x = features_mat[i]
   z = 0.0
   for j in range(0, features_dim):
     z += x[j] * weights[j]
   z += bias[0]
   pred_prob = 1.0 / (1.0 + np.exp(-z))
   pred_label = 0 if pred_prob < 0.5 else 1
   act_label = labels_mat[i]
   pred_str = ‘correct’ if np.absolute(pred_label - act_label) < 1.0e-5 \
     else ‘WRONG’
  print("%2d %0.4f %0.0f %0.0f %s" % \ (i, pred_prob, pred_label, act_label, pred_str))
x = np.array([9.5, 4.5], dtype=np.float32)
print("\nPredicting class for age, education = ")
print(x)
z = 0.0
for j in range(0, features_dim):
   z += x[j] * weights[j]
z += bias[0]
p = 1.0 / (1.0 + np.exp(-z))
print("Predicted p = " + str(p))
if p < 0.5: print("Predicted class = 0")
else: print("Predicted class = 1")
if __name__ == "__main__":
  main()

Çıktı

Ağırlıkları ve önyargı değerlerini ayarlama.

Item  pred_prob  pred_label  act_label  result
0   0.3640         0             0     correct
1   0.7254         1             0      WRONG
2   0.2019         0             0     correct
3   0.3562         0             0     correct
4   0.0493         0             0     correct
5   0.1005         0             0     correct
6   0.7892         1             1     correct
7   0.8564         1             1     correct
8   0.9654         1             1     correct
9   0.7587         1             1     correct
10  0.3040         0             1      WRONG
11  0.7129         1             1     correct
Predicting class for age, education =
[9.5 4.5]
Predicting p = 0.526487952
Predicting class = 1