CNTK - Sinir Ağı Regresyonu

Bu bölüm, CNTK ile ilgili olarak sinir ağı gerilemesini anlamanıza yardımcı olacaktır.

Giriş

Bildiğimiz gibi, bir veya daha fazla yordayıcı değişkenden sayısal bir değeri tahmin etmek için regresyon kullanırız. Örneğin 100 kasabadan birinde bir evin medyan değerini tahmin etmeye bir örnek verelim. Bunu yapmak için, aşağıdakileri içeren verilerimiz var:

  • Her kasaba için bir suç istatistiği.

  • Her kasabadaki evlerin yaşı.

  • Her şehirden birincil konuma olan mesafenin ölçüsü.

  • Her kasabadaki öğrenci-öğretmen oranı.

  • Her kasaba için ırksal demografik istatistik.

  • Her kasabadaki ortanca ev değeri.

Bu beş yordayıcı değişkene dayanarak, medyan ev değerini tahmin etmek istiyoruz. Ve bunun için aşağıdaki çizgileri boyunca doğrusal bir regresyon modeli oluşturabiliriz.

Y = a0+a1(crime)+a2(house-age)+(a3)(distance)+(a4)(ratio)+(a5)(racial)

Yukarıdaki denklemde -

Y tahmini bir medyan değerdir

a0 bir sabittir ve

a1'den a5'in tümü, yukarıda tartıştığımız beş öngörücü ile ilişkili sabitlerdir.

Ayrıca bir sinir ağı kullanmak için alternatif bir yaklaşımımız var. Daha doğru tahmin modeli oluşturacaktır.

Burada CNTK kullanarak bir sinir ağı regresyon modeli oluşturacağız.

Veri Kümesi Yükleniyor

CNTK kullanarak Sinir Ağı regresyonunu uygulamak için Boston alan ev değerleri veri setini kullanacağız. Veri seti, şu adreste bulunan UCI Machine Learning Repository'den indirilebilir.https://archive.ics.uci.edu/ml/machine-learning-databases/housing/. Bu veri kümesinde toplam 14 değişken ve 506 örnek vardır.

Ancak, uygulama programımız için 14 değişken ve 100 örnekten altısını kullanacağız. 6 üzerinden, 5 öngörü olarak ve biri de tahmin edilecek değer olarak. 100 örnekten eğitim için 80, test amaçlı 20 örnek kullanacağız. Tahmin etmek istediğimiz değer, bir kasabadaki ortalama ev fiyatıdır. Kullanacağımız beş belirleyiciyi görelim -

  • Crime per capita in the town - Bu tahmin edici ile daha küçük değerlerin ilişkilendirilmesini bekleriz.

  • Proportion of owner - 1940'tan önce inşa edilen işgal edilmiş birimler - Daha büyük değer daha eski ev anlamına geldiği için daha küçük değerlerin bu öngörücü ile ilişkilendirilmesini beklerdik.

  • Weighed distance of the town to five Boston employment centers.

  • Area school pupil-to-teacher ratio.

  • An indirect metric of the proportion of black residents in the town.

Eğitim ve test dosyalarını hazırlama

Daha önce yaptığımız gibi öncelikle ham veriyi CNTK formatına çevirmemiz gerekiyor. İlk 80 veri öğesini eğitim amaçlı kullanacağız, bu nedenle sekmeyle ayrılmış CNTK formatı aşağıdaki gibidir -

|predictors 1.612820 96.90 3.76 21.00 248.31 |medval 13.50
|predictors 0.064170 68.20 3.36 19.20 396.90 |medval 18.90
|predictors 0.097440 61.40 3.38 19.20 377.56 |medval 20.00
. . .

Yine CNTK formatına dönüştürülen sonraki 20 öğe test amaçlı kullanılacak.

Regresyon modeli oluşturma

Öncelikle veri dosyalarını CNTK formatında işlememiz gerekiyor ve bunun için isimli helper fonksiyonunu kullanacağız. create_reader aşağıdaki gibi -

def create_reader(path, input_dim, output_dim, rnd_order, sweeps):
x_strm = C.io.StreamDef(field='predictors', shape=input_dim, is_sparse=False)
y_strm = C.io.StreamDef(field='medval', shape=output_dim, is_sparse=False)
streams = C.io.StreamDefs(x_src=x_strm, y_src=y_strm)
deserial = C.io.CTFDeserializer(path, streams)
mb_src = C.io.MinibatchSource(deserial, randomize=rnd_order, max_sweeps=sweeps)
return mb_src

Daha sonra, bir CNTK mini toplu nesnesini kabul eden ve özel bir doğruluk ölçüsü hesaplayan bir yardımcı işlev oluşturmamız gerekir.

def mb_accuracy(mb, x_var, y_var, model, delta):
   num_correct = 0
   num_wrong = 0
   x_mat = mb[x_var].asarray()
   y_mat = mb[y_var].asarray()
for i in range(mb[x_var].shape[0]):
  v = model.eval(x_mat[i])
  y = y_mat[i]
if np.abs(v[0,0] – y[0,0]) < delta:
   num_correct += 1
else:
   num_wrong += 1
return (num_correct * 100.0)/(num_correct + num_wrong)

Şimdi, NN'miz için mimari argümanlarını ayarlamamız ve ayrıca veri dosyalarının konumunu sağlamamız gerekiyor. Aşağıdaki python kodunu kullanarak yapılabilir -

def main():
print("Using CNTK version = " + str(C.__version__) + "\n")
input_dim = 5
hidden_dim = 20
output_dim = 1
train_file = ".\\...\\" #provide the name of the training file(80 data items)
test_file = ".\\...\\" #provide the name of the test file(20 data items)

Şimdi, aşağıdaki kod satırının yardımıyla programımız eğitimsiz NN'yi oluşturacak -

X = C.ops.input_variable(input_dim, np.float32)
Y = C.ops.input_variable(output_dim, np.float32)
with C.layers.default_options(init=C.initializer.uniform(scale=0.01, seed=1)):
hLayer = C.layers.Dense(hidden_dim, activation=C.ops.tanh, name='hidLayer')(X)
oLayer = C.layers.Dense(output_dim, activation=None, name='outLayer')(hLayer)
model = C.ops.alias(oLayer)

Şimdi, ikili eğitimsiz modeli oluşturduktan sonra, bir Öğrenci algoritma nesnesi oluşturmamız gerekiyor. SGD öğrenicisini kullanacağız vesquared_error kayıp fonksiyonu -

tr_loss = C.squared_error(model, Y)
max_iter = 3000
batch_size = 5
base_learn_rate = 0.02
sch=C.learning_parameter_schedule([base_learn_rate, base_learn_rate/2], minibatch_size=batch_size, epoch_size=int((max_iter*batch_size)/2))
learner = C.sgd(model.parameters, sch)
trainer = C.Trainer(model, (tr_loss), [learner])

Şimdi, Öğrenme algoritması nesnesini bitirdiğimizde, eğitim verilerini okumak için bir okuyucu işlevi oluşturmamız gerekiyor -

rdr = create_reader(train_file, input_dim, output_dim, rnd_order=True, sweeps=C.io.INFINITELY_REPEAT)
boston_input_map = { X : rdr.streams.x_src, Y : rdr.streams.y_src }

Şimdi, NN modelimizi eğitme zamanı -

for i in range(0, max_iter):
curr_batch = rdr.next_minibatch(batch_size, input_map=boston_input_map) trainer.train_minibatch(curr_batch)
if i % int(max_iter/10) == 0:
mcee = trainer.previous_minibatch_loss_average
acc = mb_accuracy(curr_batch, X, Y, model, delta=3.00)
print("batch %4d: mean squared error = %8.4f, accuracy = %5.2f%% " \ % (i, mcee, acc))

Eğitimi tamamladıktan sonra, modeli test veri öğelerini kullanarak değerlendirelim -

print("\nEvaluating test data \n")
rdr = create_reader(test_file, input_dim, output_dim, rnd_order=False, sweeps=1)
boston_input_map = { X : rdr.streams.x_src, Y : rdr.streams.y_src }
num_test = 20
all_test = rdr.next_minibatch(num_test, input_map=boston_input_map)
acc = mb_accuracy(all_test, X, Y, model, delta=3.00)
print("Prediction accuracy = %0.2f%%" % acc)

Eğitimli NN modelimizin doğruluğunu değerlendirdikten sonra, onu görünmeyen veriler hakkında bir tahmin yapmak için kullanacağız -

np.set_printoptions(precision = 2, suppress=True)
unknown = np.array([[0.09, 50.00, 4.5, 17.00, 350.00], dtype=np.float32)
print("\nPredicting median home value for feature/predictor values: ")
print(unknown[0])
pred_prob = model.eval({X: unknown)
print("\nPredicted value is: ")
print(“$%0.2f (x1000)” %pred_value[0,0])

Tam Regresyon Modeli

import numpy as np
import cntk as C
def create_reader(path, input_dim, output_dim, rnd_order, sweeps):
x_strm = C.io.StreamDef(field='predictors', shape=input_dim, is_sparse=False)
y_strm = C.io.StreamDef(field='medval', shape=output_dim, is_sparse=False)
streams = C.io.StreamDefs(x_src=x_strm, y_src=y_strm)
deserial = C.io.CTFDeserializer(path, streams)
mb_src = C.io.MinibatchSource(deserial, randomize=rnd_order, max_sweeps=sweeps)
return mb_src
def mb_accuracy(mb, x_var, y_var, model, delta):
num_correct = 0
num_wrong = 0
x_mat = mb[x_var].asarray()
y_mat = mb[y_var].asarray()
for i in range(mb[x_var].shape[0]):
   v = model.eval(x_mat[i])
   y = y_mat[i]
if np.abs(v[0,0] – y[0,0]) < delta:
   num_correct += 1
else:
   num_wrong += 1
return (num_correct * 100.0)/(num_correct + num_wrong)
def main():
print("Using CNTK version = " + str(C.__version__) + "\n")
input_dim = 5
hidden_dim = 20
output_dim = 1
train_file = ".\\...\\" #provide the name of the training file(80 data items)
test_file = ".\\...\\" #provide the name of the test file(20 data items)
X = C.ops.input_variable(input_dim, np.float32)
Y = C.ops.input_variable(output_dim, np.float32)
with C.layers.default_options(init=C.initializer.uniform(scale=0.01, seed=1)):
hLayer = C.layers.Dense(hidden_dim, activation=C.ops.tanh, name='hidLayer')(X)
oLayer = C.layers.Dense(output_dim, activation=None, name='outLayer')(hLayer)
model = C.ops.alias(oLayer)
tr_loss = C.squared_error(model, Y)
max_iter = 3000
batch_size = 5
base_learn_rate = 0.02
sch = C.learning_parameter_schedule([base_learn_rate, base_learn_rate/2], minibatch_size=batch_size, epoch_size=int((max_iter*batch_size)/2))
learner = C.sgd(model.parameters, sch)
trainer = C.Trainer(model, (tr_loss), [learner])
rdr = create_reader(train_file, input_dim, output_dim, rnd_order=True, sweeps=C.io.INFINITELY_REPEAT)
boston_input_map = { X : rdr.streams.x_src, Y : rdr.streams.y_src }
for i in range(0, max_iter):
curr_batch = rdr.next_minibatch(batch_size, input_map=boston_input_map) trainer.train_minibatch(curr_batch)
if i % int(max_iter/10) == 0:
   mcee = trainer.previous_minibatch_loss_average
   acc = mb_accuracy(curr_batch, X, Y, model, delta=3.00)
   print("batch %4d: mean squared error = %8.4f, accuracy = %5.2f%% " \ % (i, mcee, acc))
   print("\nEvaluating test data \n")
   rdr = create_reader(test_file, input_dim, output_dim, rnd_order=False, sweeps=1)
   boston_input_map = { X : rdr.streams.x_src, Y : rdr.streams.y_src }
   num_test = 20
all_test = rdr.next_minibatch(num_test, input_map=boston_input_map)
acc = mb_accuracy(all_test, X, Y, model, delta=3.00)
print("Prediction accuracy = %0.2f%%" % acc)
np.set_printoptions(precision = 2, suppress=True)
unknown = np.array([[0.09, 50.00, 4.5, 17.00, 350.00], dtype=np.float32)
print("\nPredicting median home value for feature/predictor values: ")
print(unknown[0])
pred_prob = model.eval({X: unknown)
print("\nPredicted value is: ")
print(“$%0.2f (x1000)” %pred_value[0,0])
if __name__== ”__main__”:
   main()

Çıktı

Using CNTK version = 2.7
batch 0: mean squared error = 385.6727, accuracy = 0.00%
batch 300: mean squared error = 41.6229, accuracy = 20.00%
batch 600: mean squared error = 28.7667, accuracy = 40.00%
batch 900: mean squared error = 48.6435, accuracy = 40.00%
batch 1200: mean squared error = 77.9562, accuracy = 80.00%
batch 1500: mean squared error = 7.8342, accuracy = 60.00%
batch 1800: mean squared error = 47.7062, accuracy = 60.00%
batch 2100: mean squared error = 40.5068, accuracy = 40.00%
batch 2400: mean squared error = 46.5023, accuracy = 40.00%
batch 2700: mean squared error = 15.6235, accuracy = 60.00%
Evaluating test data
Prediction accuracy = 64.00%
Predicting median home value for feature/predictor values:
[0.09 50. 4.5 17. 350.]
Predicted value is:
$21.02(x1000)

Eğitimli modeli kaydetme

Bu Boston Home değeri veri kümesinde yalnızca 506 veri öğesi var (bunlardan yalnızca 100 tanesine dava açtık). Bu nedenle, NN regresör modelini eğitmek yalnızca birkaç saniye sürer, ancak yüz veya bin veri öğesi içeren büyük bir veri kümesi üzerinde eğitim saatler hatta günler alabilir.

Modelimizi kurtarabiliriz, böylece onu sıfırdan korumak zorunda kalmayız. Python kodunu takip etmenin yardımıyla, eğitimli NN'mizi kaydedebiliriz -

nn_regressor = “.\\neuralregressor.model” #provide the name of the file
model.save(nn_regressor, format=C.ModelFormat.CNTKv2)

Yukarıda kullanılan kaydet () fonksiyonunun argümanları aşağıdadır -

  • Dosya adı ilk argümandır save()işlevi. Dosya yolu ile birlikte de yazılabilir.

  • Başka bir parametre de format varsayılan değeri olan parametre C.ModelFormat.CNTKv2.

Eğitimli modeli yükleme

Eğitimli modeli kaydettikten sonra, bu modeli yüklemek çok kolaydır. Sadece load () işlevini kullanmamız gerekiyor. Bunu aşağıdaki örnekte kontrol edelim -

import numpy as np
import cntk as C
model = C.ops.functions.Function.load(“.\\neuralregressor.model”)
np.set_printoptions(precision = 2, suppress=True)
unknown = np.array([[0.09, 50.00, 4.5, 17.00, 350.00], dtype=np.float32)
print("\nPredicting area median home value for feature/predictor values: ")
print(unknown[0])
pred_prob = model.eval({X: unknown)
print("\nPredicted value is: ")
print(“$%0.2f (x1000)” %pred_value[0,0])

Kaydedilen modelin yararı, kaydedilmiş bir modeli yüklediğinizde, tam olarak model henüz eğitilmiş gibi kullanılabilmesidir.