TensorFlow - आवर्तक तंत्रिका नेटवर्क

आवर्तक तंत्रिका नेटवर्क एक प्रकार का गहन शिक्षण-उन्मुख एल्गोरिथ्म है, जो क्रमबद्ध दृष्टिकोण का अनुसरण करता है। तंत्रिका नेटवर्क में, हम हमेशा यह मानते हैं कि प्रत्येक इनपुट और आउटपुट अन्य सभी परतों से स्वतंत्र है। इस प्रकार के तंत्रिका नेटवर्क को आवर्तक कहा जाता है क्योंकि वे क्रमबद्ध तरीके से गणितीय संगणना करते हैं।

एक आवर्ती तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए निम्नलिखित चरणों पर विचार करें -

Step 1 - डेटासेट से एक विशिष्ट उदाहरण इनपुट करें।

Step 2 - नेटवर्क एक उदाहरण लेगा और बेतरतीब ढंग से आरंभिक चर का उपयोग करके कुछ गणनाओं की गणना करेगा।

Step 3 - एक अनुमानित परिणाम तब गणना की जाती है।

Step 4 - अपेक्षित मूल्य के साथ उत्पन्न वास्तविक परिणाम की तुलना एक त्रुटि पैदा करेगी।

Step 5 - त्रुटि का पता लगाने के लिए, इसे उसी पथ के माध्यम से प्रचारित किया जाता है जहां चर भी समायोजित किए जाते हैं।

Step 6 - 1 से 5 तक के चरणों को दोहराया जाता है जब तक हम आश्वस्त नहीं होते कि आउटपुट प्राप्त करने के लिए घोषित चर ठीक से परिभाषित हैं।

Step 7 - नया अनदेखा इनपुट प्राप्त करने के लिए इन चर को लागू करके एक व्यवस्थित भविष्यवाणी की जाती है।

आवर्तक तंत्रिका नेटवर्क का प्रतिनिधित्व करने का योजनाबद्ध तरीका नीचे वर्णित है -

TensorFlow के साथ आवर्तक तंत्रिका नेटवर्क कार्यान्वयन

इस खंड में, हम सीखेंगे कि TensorFlow के साथ आवर्तक तंत्रिका नेटवर्क को कैसे लागू किया जाए।

Step 1 - TensorFlow में आवर्तक तंत्रिका नेटवर्क मॉड्यूल के विशिष्ट कार्यान्वयन के लिए विभिन्न पुस्तकालय शामिल हैं।

#Import necessary modules
from __future__ import print_function

import tensorflow as tf
from tensorflow.contrib import rnn
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True)

जैसा कि ऊपर उल्लेख किया गया है, पुस्तकालय इनपुट डेटा को परिभाषित करने में मदद करते हैं, जो आवर्तक तंत्रिका नेटवर्क कार्यान्वयन का प्राथमिक हिस्सा बनता है।

Step 2- हमारा प्राथमिक उद्देश्य एक आवर्तक तंत्रिका नेटवर्क का उपयोग करके छवियों को वर्गीकृत करना है, जहां हम प्रत्येक छवि पंक्ति को पिक्सेल के अनुक्रम के रूप में मानते हैं। MNIST छवि आकृति को विशेष रूप से 28 * 28 px के रूप में परिभाषित किया गया है। अब हम प्रत्येक नमूने के लिए 28 चरणों के 28 अनुक्रमों का उल्लेख करेंगे। हम अनुक्रमिक पैटर्न को पूरा करने के लिए इनपुट मापदंडों को परिभाषित करेंगे।

n_input = 28 # MNIST data input with img shape 28*28
n_steps = 28
n_hidden = 128
n_classes = 10

# tf Graph input
x = tf.placeholder("float", [None, n_steps, n_input])
y = tf.placeholder("float", [None, n_classes]
weights = {
   'out': tf.Variable(tf.random_normal([n_hidden, n_classes]))
}
biases = {
   'out': tf.Variable(tf.random_normal([n_classes]))
}

Step 3- सर्वोत्तम परिणाम प्राप्त करने के लिए RNN में परिभाषित फ़ंक्शन का उपयोग करके परिणामों की गणना करें। यहां, प्रत्येक डेटा आकार की वर्तमान इनपुट आकार के साथ तुलना की जाती है और सटीकता दर को बनाए रखने के लिए परिणामों की गणना की जाती है।

def RNN(x, weights, biases):
   x = tf.unstack(x, n_steps, 1)

   # Define a lstm cell with tensorflow
   lstm_cell = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)

   # Get lstm cell output
   outputs, states = rnn.static_rnn(lstm_cell, x, dtype = tf.float32)

   # Linear activation, using rnn inner loop last output
   return tf.matmul(outputs[-1], weights['out']) + biases['out']

pred = RNN(x, weights, biases)

# Define loss and optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits = pred, labels = y))
optimizer = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cost)

# Evaluate model
correct_pred = tf.equal(tf.argmax(pred,1), tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# Initializing the variables
init = tf.global_variables_initializer()

Step 4- इस चरण में, हम कम्प्यूटेशनल परिणाम प्राप्त करने के लिए ग्राफ लॉन्च करेंगे। यह परीक्षण परिणामों के लिए सटीकता की गणना करने में भी मदद करता है।

with tf.Session() as sess:
   sess.run(init)
   step = 1
   # Keep training until reach max iterations
   
   while step * batch_size < training_iters:
      batch_x, batch_y = mnist.train.next_batch(batch_size)
      batch_x = batch_x.reshape((batch_size, n_steps, n_input))
      sess.run(optimizer, feed_dict={x: batch_x, y: batch_y})
      
      if step % display_step == 0:
         # Calculate batch accuracy
         acc = sess.run(accuracy, feed_dict={x: batch_x, y: batch_y})
         
         # Calculate batch loss
         loss = sess.run(cost, feed_dict={x: batch_x, y: batch_y})
         
         print("Iter " + str(step*batch_size) + ", Minibatch Loss= " + \
            "{:.6f}".format(loss) + ", Training Accuracy= " + \
            "{:.5f}".format(acc))
      step += 1
   print("Optimization Finished!")
      test_len = 128
   test_data = mnist.test.images[:test_len].reshape((-1, n_steps, n_input))
   
   test_label = mnist.test.labels[:test_len]
   print("Testing Accuracy:", \
      sess.run(accuracy, feed_dict={x: test_data, y: test_label}))

नीचे दिए गए स्क्रीनशॉट उत्पन्न उत्पादन को दिखाते हैं -