TensorFlow - Jaringan Neural Berulang

Jaringan saraf rekuren adalah jenis algoritme berorientasi pembelajaran mendalam, yang mengikuti pendekatan sekuensial. Dalam jaringan neural, kami selalu berasumsi bahwa setiap masukan dan keluaran tidak bergantung pada semua lapisan lainnya. Jenis jaringan saraf ini disebut berulang karena mereka melakukan komputasi matematis secara berurutan.

Pertimbangkan langkah-langkah berikut untuk melatih jaringan saraf berulang -

Step 1 - Masukkan contoh spesifik dari dataset.

Step 2 - Jaringan akan mengambil contoh dan menghitung beberapa kalkulasi menggunakan variabel yang diinisialisasi secara acak.

Step 3 - Hasil prediksi kemudian dihitung.

Step 4 - Perbandingan hasil aktual yang dihasilkan dengan nilai yang diharapkan akan menghasilkan kesalahan.

Step 5 - Untuk melacak kesalahan, itu disebarkan melalui jalur yang sama di mana variabel juga disesuaikan.

Step 6 - Langkah-langkah dari 1 sampai 5 diulangi sampai kita yakin bahwa variabel yang dideklarasikan untuk mendapatkan keluaran didefinisikan dengan benar.

Step 7 - Prediksi sistematis dibuat dengan menerapkan variabel-variabel ini untuk mendapatkan masukan baru yang tidak terlihat.

Pendekatan skematis untuk merepresentasikan jaringan saraf berulang dijelaskan di bawah ini -

Implementasi Jaringan Neural Berulang dengan TensorFlow

Di bagian ini, kita akan mempelajari cara mengimplementasikan jaringan neural berulang dengan TensorFlow.

Step 1 - TensorFlow menyertakan berbagai pustaka untuk implementasi spesifik dari modul jaringan neural berulang.

#Import necessary modules
from __future__ import print_function

import tensorflow as tf
from tensorflow.contrib import rnn
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True)

Seperti yang disebutkan di atas, perpustakaan membantu dalam menentukan data masukan, yang merupakan bagian utama dari implementasi jaringan saraf berulang.

Step 2- Motif utama kami adalah mengklasifikasikan gambar menggunakan jaringan saraf berulang, di mana kami menganggap setiap baris gambar sebagai urutan piksel. Bentuk gambar MNIST secara khusus didefinisikan sebagai 28 * 28 px. Sekarang kita akan menangani 28 urutan dari 28 langkah untuk setiap sampel yang disebutkan. Kami akan menentukan parameter input untuk menyelesaikan pola sekuensial.

n_input = 28 # MNIST data input with img shape 28*28
n_steps = 28
n_hidden = 128
n_classes = 10

# tf Graph input
x = tf.placeholder("float", [None, n_steps, n_input])
y = tf.placeholder("float", [None, n_classes]
weights = {
   'out': tf.Variable(tf.random_normal([n_hidden, n_classes]))
}
biases = {
   'out': tf.Variable(tf.random_normal([n_classes]))
}

Step 3- Hitung hasil menggunakan fungsi yang ditentukan di RNN untuk mendapatkan hasil terbaik. Di sini, setiap bentuk data dibandingkan dengan bentuk masukan saat ini dan hasilnya dihitung untuk menjaga tingkat akurasi.

def RNN(x, weights, biases):
   x = tf.unstack(x, n_steps, 1)

   # Define a lstm cell with tensorflow
   lstm_cell = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)

   # Get lstm cell output
   outputs, states = rnn.static_rnn(lstm_cell, x, dtype = tf.float32)

   # Linear activation, using rnn inner loop last output
   return tf.matmul(outputs[-1], weights['out']) + biases['out']

pred = RNN(x, weights, biases)

# Define loss and optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits = pred, labels = y))
optimizer = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cost)

# Evaluate model
correct_pred = tf.equal(tf.argmax(pred,1), tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# Initializing the variables
init = tf.global_variables_initializer()

Step 4- Pada langkah ini, kami akan meluncurkan grafik untuk mendapatkan hasil komputasi. Ini juga membantu dalam menghitung keakuratan hasil tes.

with tf.Session() as sess:
   sess.run(init)
   step = 1
   # Keep training until reach max iterations
   
   while step * batch_size < training_iters:
      batch_x, batch_y = mnist.train.next_batch(batch_size)
      batch_x = batch_x.reshape((batch_size, n_steps, n_input))
      sess.run(optimizer, feed_dict={x: batch_x, y: batch_y})
      
      if step % display_step == 0:
         # Calculate batch accuracy
         acc = sess.run(accuracy, feed_dict={x: batch_x, y: batch_y})
         
         # Calculate batch loss
         loss = sess.run(cost, feed_dict={x: batch_x, y: batch_y})
         
         print("Iter " + str(step*batch_size) + ", Minibatch Loss= " + \
            "{:.6f}".format(loss) + ", Training Accuracy= " + \
            "{:.5f}".format(acc))
      step += 1
   print("Optimization Finished!")
      test_len = 128
   test_data = mnist.test.images[:test_len].reshape((-1, n_steps, n_input))
   
   test_label = mnist.test.labels[:test_len]
   print("Testing Accuracy:", \
      sess.run(accuracy, feed_dict={x: test_data, y: test_label}))

Tangkapan layar di bawah ini menunjukkan keluaran yang dihasilkan -