CNTK - İlk Sinir Ağının Oluşturulması
Bu bölüm, CNTK'da bir sinir ağı oluşturmayı ayrıntılı olarak ele alacaktır.
Ağ yapısını oluşturun
İlk NN'mizi oluşturmak için CNTK konseptlerini uygulamak için, iris çiçeği türlerini yaprak genişliği ve uzunluğu ile petal genişliği ve uzunluğunun fiziksel özelliklerine göre sınıflandırmak için NN kullanacağız. Farklı iris çiçeklerinin fiziksel özelliklerini tanımlayan iris veri setini kullanacağımız veri seti -
- Sepal uzunluk
- Sepal genişlik
- Petal uzunluğu
- Petal genişliği
- Sınıf ie iris setosa veya iris versicolor veya iris virginica
Burada, ileri beslemeli NN adı verilen normal bir NN oluşturacağız. NN'nin yapısını oluşturmak için uygulama adımlarını görelim -
Step 1 - Öncelikle, katman türlerimiz, etkinleştirme işlevlerimiz ve NN'miz için bir girdi değişkeni tanımlamamıza izin veren bir işlev gibi gerekli bileşenleri CNTK kitaplığından içe aktaracağız.
from cntk import default_options, input_variable
from cntk.layers import Dense, Sequential
from cntk.ops import log_softmax, relu
Step 2- Bundan sonra sıralı fonksiyonu kullanarak modelimizi oluşturacağız. Oluşturulduktan sonra, onu istediğimiz katmanlarla besleyeceğiz. Burada, NN'mizde iki farklı katman oluşturacağız; biri dört nöronlu, diğeri üç nöronlu.
model = Sequential([Dense(4, activation=relu), Dense(3, activation=log_sogtmax)])
Step 3- Sonunda, NN'yi derlemek için ağı giriş değişkenine bağlayacağız. Dört nöronlu bir giriş katmanına ve üç nöronlu bir çıktı katmanına sahiptir.
feature= input_variable(4)
z = model(feature)
Bir aktivasyon işlevi uygulama
Aralarından seçim yapabileceğiniz çok sayıda etkinleştirme işlevi vardır ve doğru etkinleştirme işlevini seçmek, derin öğrenme modelimizin ne kadar iyi performans göstereceği konusunda kesinlikle büyük bir fark yaratacaktır.
Çıktı katmanında
Bir seçim activation çıktı katmanındaki işlev, modelimizle çözeceğimiz sorunun türüne bağlı olacaktır.
Bir regresyon problemi için, bir linear activation function çıktı katmanında.
İkili bir sınıflandırma problemi için, bir sigmoid activation function çıktı katmanında.
Çok sınıflı sınıflandırma problemi için, bir softmax activation function çıktı katmanında.
Burada, üç sınıftan birini tahmin etmek için bir model oluşturacağız. Kullanmamız gerektiği anlamına gelirsoftmax activation function çıktı katmanında.
Gizli katmanda
Bir seçim activation gizli katmandaki işlev, hangi etkinleştirme işlevinin iyi çalıştığını görmek için performansın izlenmesi için biraz deney yapmayı gerektirir.
Bir sınıflandırma probleminde, bir numunenin belirli bir sınıfa ait olma olasılığını tahmin etmemiz gerekir. Bu yüzden ihtiyacımız varactivation functionbu bize olasılıksal değerler verir. Bu hedefe ulaşmak için,sigmoid activation function bize yardımcı olabilir.
Sigmoid işleviyle ilişkili en büyük sorunlardan biri, kaybolan gradyan problemidir. Böyle bir sorunun üstesinden gelmek için kullanabilirizReLU activation function tüm negatif değerleri sıfır olarak kapsayan ve pozitif değerler için geçiş filtresi görevi gören.
Bir kayıp fonksiyonu seçmek
NN modelimizin yapısına sahip olduğumuzda, onu optimize etmemiz gerekir. Optimize etmek için birloss function. Aksineactivation functions, seçim yapabileceğimiz çok daha az kayıp fonksiyonumuz var. Bununla birlikte, bir kayıp işlevi seçmek, modelimizle çözeceğimiz sorunun türüne bağlı olacaktır.
Örneğin, bir sınıflandırma probleminde, tahmin edilen bir sınıf ile gerçek bir sınıf arasındaki farkı ölçebilen bir kayıp fonksiyonu kullanmalıyız.
kayıp fonksiyonu
Sınıflandırma problemi için NN modelimiz ile çözeceğiz, categorical cross entropykayıp fonksiyonu en iyi adaydır. CNTK'da şu şekilde uygulanmaktadır:cross_entropy_with_softmax hangisinden ithal edilebilir cntk.losses aşağıdaki gibi paket
label= input_variable(3)
loss = cross_entropy_with_softmax(z, label)
Metrikler
NN modelimiz için yapıya ve uygulanacak bir kayıp fonksiyonuna sahip olarak, derin öğrenme modelimizi optimize etmek için tarifi yapmaya başlamak için tüm bileşenlere sahibiz. Ancak, bu konuya derinlemesine dalmadan önce, ölçüler hakkında bilgi edinmeliyiz.
cntk.metrics
CNTK adlı pakete sahip cntk.metricskullanacağımız ölçümleri içeri aktarabiliriz. Bir sınıflandırma modeli oluştururken, kullanacağızclassification_error 0 ile 1 arasında bir sayı üretecek olan matric, 0 ile 1 arasındaki sayı, doğru tahmin edilen örneklerin yüzdesini gösterir -
Öncelikle, metriği şuradan içe aktarmamız gerekiyor: cntk.metrics paket -
from cntk.metrics import classification_error
error_rate = classification_error(z, label)
Yukarıdaki işlev aslında NN'nin çıktısına ve girdi olarak beklenen etikete ihtiyaç duyar.