CNTK - Model Regresi
Di sini, kita akan mempelajari tentang mengukur kinerja yang berkaitan dengan model regresi.
Dasar-dasar memvalidasi model regresi
Seperti yang kita ketahui bahwa model regresi berbeda dengan model klasifikasi, dalam artian tidak ada ukuran biner benar atau salah untuk sampel individu. Dalam model regresi, kami ingin mengukur seberapa dekat prediksi tersebut dengan nilai sebenarnya. Semakin dekat nilai prediksi dengan keluaran yang diharapkan, semakin baik performa model.
Di sini, kita akan mengukur kinerja NN yang digunakan untuk regresi menggunakan fungsi tingkat kesalahan yang berbeda.
Menghitung margin kesalahan
Seperti yang telah dibahas sebelumnya, saat memvalidasi model regresi, kami tidak dapat mengatakan apakah prediksi itu benar atau salah. Kami ingin prediksi kami sedekat mungkin dengan nilai sebenarnya. Namun, margin kesalahan kecil dapat diterima di sini.
Rumus untuk menghitung margin kesalahan adalah sebagai berikut -
Sini,
Predicted value = ditunjukkan y dengan topi
Real value = diprediksi oleh y
Pertama, kita perlu menghitung jarak antara prediksi dan nilai sebenarnya. Kemudian, untuk mendapatkan tingkat kesalahan keseluruhan, kita perlu menjumlahkan jarak kuadrat ini dan menghitung rata-ratanya. Ini disebutmean squared fungsi kesalahan.
Tetapi, jika kita menginginkan figur kinerja yang menyatakan margin kesalahan, kita memerlukan rumus yang menyatakan kesalahan absolut. Rumus untukmean absolute fungsi kesalahan adalah sebagai berikut -
Rumus di atas mengambil jarak absolut antara prediksi dan nilai sebenarnya.
Menggunakan CNTK untuk mengukur kinerja regresi
Di sini, kita akan melihat bagaimana menggunakan metrik yang berbeda, yang kita diskusikan dalam kombinasi dengan CNTK. Kami akan menggunakan model regresi, yang memprediksi mil per galon untuk mobil menggunakan langkah-langkah yang diberikan di bawah ini.
Langkah-langkah implementasi−
Step 1 - Pertama, kita perlu mengimpor komponen yang dibutuhkan dari cntk paket sebagai berikut -
from cntk import default_option, input_variable
from cntk.layers import Dense, Sequential
from cntk.ops import relu
Step 2 - Selanjutnya, kita perlu mendefinisikan fungsi aktivasi default menggunakan default_optionsfungsi. Kemudian, buat set layer Sequential baru dan sediakan dua layer Dense dengan masing-masing 64 neuron. Kemudian, kami menambahkan lapisan Dense tambahan (yang akan bertindak sebagai lapisan keluaran) ke set lapisan Sequential dan memberikan 1 neuron tanpa aktivasi sebagai berikut -
with default_options(activation=relu):
model = Sequential([Dense(64),Dense(64),Dense(1,activation=None)])
Step 3- Setelah jaringan dibuat, kita perlu membuat fitur masukan. Kita perlu memastikan bahwa, itu memiliki bentuk yang sama dengan fitur yang akan kita gunakan untuk pelatihan.
features = input_variable(X.shape[1])
Step 4 - Sekarang, kita perlu membuat yang lain input_variable dengan ukuran 1. Ini akan digunakan untuk menyimpan nilai yang diharapkan untuk NN.
target = input_variable(1)
z = model(features)
Sekarang, kita perlu melatih model dan untuk melakukannya, kita akan membagi dataset dan melakukan preprocessing menggunakan langkah-langkah implementasi berikut -
Step 5−Pertama, impor StandardScaler dari sklearn.preprocessing untuk mendapatkan nilai antara -1 dan +1. Ini akan membantu kita melawan masalah gradien yang meledak di NN.
from sklearn.preprocessing import StandardScalar
Step 6 - Selanjutnya, impor train_test_split dari sklearn.model_selection sebagai berikut−
from sklearn.model_selection import train_test_split
Step 7 - Jatuhkan mpg kolom dari dataset dengan menggunakan dropmetode. Terakhir, pisahkan kumpulan data menjadi kumpulan pelatihan dan validasi menggunakantrain_test_split berfungsi sebagai berikut -
x = df_cars.drop(columns=[‘mpg’]).values.astype(np.float32)
y=df_cars.iloc[: , 0].values.reshape(-1, 1).astype(np.float32)
scaler = StandardScaler()
X = scaler.fit_transform(x)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
Step 8 - Sekarang, kita perlu membuat input_variable lain dengan ukuran 1. Ini akan digunakan untuk menyimpan nilai yang diharapkan untuk NN.
target = input_variable(1)
z = model(features)
Kami telah membagi dan memproses data, sekarang kami perlu melatih NN. Seperti yang dilakukan di bagian sebelumnya saat membuat model regresi, kita perlu menentukan kombinasi kerugian danmetric berfungsi untuk melatih model.
import cntk
def absolute_error(output, target):
return cntk.ops.reduce_mean(cntk.ops.abs(output – target))
@ cntk.Function
def criterion_factory(output, target):
loss = squared_error(output, target)
metric = absolute_error(output, target)
return loss, metric
Sekarang, mari kita lihat cara menggunakan model yang terlatih. Untuk model kita, kita akan menggunakan criterion_factory sebagai kombinasi kerugian dan metrik.
from cntk.losses import squared_error
from cntk.learners import sgd
from cntk.logging import ProgressPrinter
progress_printer = ProgressPrinter(0)
loss = criterion_factory (z, target)
learner = sgd(z.parameters, 0.001)
training_summary=loss.train((x_train,y_train),parameter_learners=[learner],callbacks=[progress_printer],minibatch_size=16,max_epochs=10)
Contoh implementasi lengkap
from cntk import default_option, input_variable
from cntk.layers import Dense, Sequential
from cntk.ops import relu
with default_options(activation=relu):
model = Sequential([Dense(64),Dense(64),Dense(1,activation=None)])
features = input_variable(X.shape[1])
target = input_variable(1)
z = model(features)
from sklearn.preprocessing import StandardScalar
from sklearn.model_selection import train_test_split
x = df_cars.drop(columns=[‘mpg’]).values.astype(np.float32)
y=df_cars.iloc[: , 0].values.reshape(-1, 1).astype(np.float32)
scaler = StandardScaler()
X = scaler.fit_transform(x)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
target = input_variable(1)
z = model(features)
import cntk
def absolute_error(output, target):
return cntk.ops.reduce_mean(cntk.ops.abs(output – target))
@ cntk.Function
def criterion_factory(output, target):
loss = squared_error(output, target)
metric = absolute_error(output, target)
return loss, metric
from cntk.losses import squared_error
from cntk.learners import sgd
from cntk.logging import ProgressPrinter
progress_printer = ProgressPrinter(0)
loss = criterion_factory (z, target)
learner = sgd(z.parameters, 0.001)
training_summary=loss.train((x_train,y_train),parameter_learners=[learner],callbacks=[progress_printer],minibatch_size=16,max_epochs=10)
Keluaran
-------------------------------------------------------------------
average since average since examples
loss last metric last
------------------------------------------------------
Learning rate per minibatch: 0.001
690 690 24.9 24.9 16
654 636 24.1 23.7 48
[………]
Untuk memvalidasi model regresi kita, kita perlu memastikan bahwa model tersebut menangani data baru seperti halnya dengan data pelatihan. Untuk ini, kita perlu memanggiltest metode aktif loss dan metric kombinasi dengan data uji sebagai berikut -
loss.test([X_test, y_test])
Keluaran-
{'metric': 1.89679785619, 'samples': 79}