CNTK - Regresyon Modeli
Burada, regresyon modeline göre performansı ölçmeyi inceleyeceğiz.
Bir regresyon modelini doğrulamanın temelleri
Regresyon modellerinin sınıflandırma modellerinden farklı olduğunu bildiğimiz için, bireylerin örneklemleri için doğru veya yanlışın ikili bir ölçüsü yoktur. Regresyon modellerinde, tahminin gerçek değere ne kadar yakın olduğunu ölçmek istiyoruz. Tahmin değeri beklenen çıktıya ne kadar yakınsa, model o kadar iyi performans gösterir.
Burada, farklı hata oranı fonksiyonlarını kullanarak regresyon için kullanılan NN'nin performansını ölçeceğiz.
Hata payının hesaplanması
Daha önce tartışıldığı gibi, bir regresyon modelini doğrularken, bir tahminin doğru mu yanlış mı olduğunu söyleyemeyiz. Tahminimizin mümkün olduğunca gerçek değere yakın olmasını istiyoruz. Ancak burada küçük bir hata payı kabul edilebilir.
Hata payını hesaplamanın formülü aşağıdaki gibidir -
Buraya,
Predicted value = y bir şapka ile gösterilir
Real value = y tarafından tahmin edildi
İlk olarak, tahmin edilen ile gerçek değer arasındaki mesafeyi hesaplamamız gerekir. Ardından, genel bir hata oranı elde etmek için, bu kare mesafeleri toplamamız ve ortalamayı hesaplamamız gerekir. Bu denirmean squared hata işlevi.
Ancak, bir hata payını ifade eden performans rakamları istiyorsak, mutlak hatayı ifade eden bir formüle ihtiyacımız var. Formülümean absolute hata fonksiyonu aşağıdaki gibidir -
Yukarıdaki formül, tahmin edilen ve gerçek değer arasındaki mutlak mesafeyi alır.
Regresyon performansını ölçmek için CNTK kullanma
Burada, CNTK ile birlikte tartıştığımız farklı metriklerin nasıl kullanılacağına bakacağız. Aşağıda verilen adımları kullanarak otomobiller için galon başına mili tahmin eden bir regresyon modeli kullanacağız.
Uygulama adımları−
Step 1 - Öncelikle, gerekli bileşenleri şuradan içe aktarmamız gerekiyor: cntk aşağıdaki gibi paket -
from cntk import default_option, input_variable
from cntk.layers import Dense, Sequential
from cntk.ops import relu
Step 2 - Daha sonra, bir varsayılan etkinleştirme işlevi tanımlamamız gerekir. default_optionsfonksiyonlar. Ardından, yeni bir Sıralı katman seti oluşturun ve her biri 64 nöron içeren iki Yoğun katman sağlayın. Ardından, Ardışık katman setine ek bir Yoğun katman (çıktı katmanı olarak işlev görecek) ekliyoruz ve aşağıdaki gibi bir aktivasyon olmadan 1 nöron veriyoruz -
with default_options(activation=relu):
model = Sequential([Dense(64),Dense(64),Dense(1,activation=None)])
Step 3- Ağ oluşturulduktan sonra, bir giriş özelliği oluşturmamız gerekir. Eğitim için kullanacağımız özelliklerle aynı şekle sahip olduğundan emin olmalıyız.
features = input_variable(X.shape[1])
Step 4 - Şimdi bir tane daha yaratmalıyız input_variable boyut 1 ile. NN için beklenen değeri saklamak için kullanılacaktır.
target = input_variable(1)
z = model(features)
Şimdi, modeli eğitmemiz gerekiyor ve bunu yapmak için, aşağıdaki uygulama adımlarını kullanarak veri setini bölecek ve ön işleme gerçekleştireceğiz -
Step 5−İlk olarak, -1 ile +1 arasındaki değerleri elde etmek için sklearn.preprocessing'den StandardScaler'ı içe aktarın. Bu, NN'de patlayan gradyan problemlerine karşı bize yardımcı olacaktır.
from sklearn.preprocessing import StandardScalar
Step 6 - Sonra, train_test_split'i sklearn.model_selection'dan aşağıdaki gibi içe aktarın−
from sklearn.model_selection import train_test_split
Step 7 - Bırak mpg kullanarak veri kümesindeki sütun dropyöntem. Sonunda, veri kümesini bir eğitim ve doğrulama kümesine bölün.train_test_split aşağıdaki gibi işlev -
x = df_cars.drop(columns=[‘mpg’]).values.astype(np.float32)
y=df_cars.iloc[: , 0].values.reshape(-1, 1).astype(np.float32)
scaler = StandardScaler()
X = scaler.fit_transform(x)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
Step 8 - Şimdi, boyut 1 ile başka bir input_variable yaratmamız gerekiyor. Bu, NN için beklenen değeri saklamak için kullanılacak.
target = input_variable(1)
z = model(features)
Verileri önceden işlemenin yanı sıra böldük, şimdi NN'yi eğitmemiz gerekiyor. Regresyon modeli oluştururken önceki bölümlerde olduğu gibi, bir kayıp vemetric Modeli eğitmek için işlev.
import cntk
def absolute_error(output, target):
return cntk.ops.reduce_mean(cntk.ops.abs(output – target))
@ cntk.Function
def criterion_factory(output, target):
loss = squared_error(output, target)
metric = absolute_error(output, target)
return loss, metric
Şimdi eğitilmiş modelin nasıl kullanılacağına bir göz atalım. Modelimiz için, kayıp ve metrik kombinasyonu olarak criterion_factory kullanacağız.
from cntk.losses import squared_error
from cntk.learners import sgd
from cntk.logging import ProgressPrinter
progress_printer = ProgressPrinter(0)
loss = criterion_factory (z, target)
learner = sgd(z.parameters, 0.001)
training_summary=loss.train((x_train,y_train),parameter_learners=[learner],callbacks=[progress_printer],minibatch_size=16,max_epochs=10)
Eksiksiz uygulama örneği
from cntk import default_option, input_variable
from cntk.layers import Dense, Sequential
from cntk.ops import relu
with default_options(activation=relu):
model = Sequential([Dense(64),Dense(64),Dense(1,activation=None)])
features = input_variable(X.shape[1])
target = input_variable(1)
z = model(features)
from sklearn.preprocessing import StandardScalar
from sklearn.model_selection import train_test_split
x = df_cars.drop(columns=[‘mpg’]).values.astype(np.float32)
y=df_cars.iloc[: , 0].values.reshape(-1, 1).astype(np.float32)
scaler = StandardScaler()
X = scaler.fit_transform(x)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
target = input_variable(1)
z = model(features)
import cntk
def absolute_error(output, target):
return cntk.ops.reduce_mean(cntk.ops.abs(output – target))
@ cntk.Function
def criterion_factory(output, target):
loss = squared_error(output, target)
metric = absolute_error(output, target)
return loss, metric
from cntk.losses import squared_error
from cntk.learners import sgd
from cntk.logging import ProgressPrinter
progress_printer = ProgressPrinter(0)
loss = criterion_factory (z, target)
learner = sgd(z.parameters, 0.001)
training_summary=loss.train((x_train,y_train),parameter_learners=[learner],callbacks=[progress_printer],minibatch_size=16,max_epochs=10)
Çıktı
-------------------------------------------------------------------
average since average since examples
loss last metric last
------------------------------------------------------
Learning rate per minibatch: 0.001
690 690 24.9 24.9 16
654 636 24.1 23.7 48
[………]
Regresyon modelimizi doğrulamak için, modelin yeni verileri tıpkı eğitim verileriyle olduğu gibi işlediğinden emin olmalıyız. Bunun için,test yöntem loss ve metric aşağıdaki gibi test verileriyle kombinasyon -
loss.test([X_test, y_test])
Çıktı−
{'metric': 1.89679785619, 'samples': 79}