TensorFlow - सिंगल लेयर परसेप्ट्रॉन

सिंगल लेयर परसेप्ट्रॉन को समझने के लिए आर्टिफिशियल न्यूरल नेटवर्क्स (ANN) को समझना जरूरी है। कृत्रिम तंत्रिका नेटवर्क सूचना प्रसंस्करण प्रणाली है जिसका तंत्र जैविक तंत्रिका सर्किट की कार्यक्षमता से प्रेरित है। एक कृत्रिम तंत्रिका नेटवर्क में एक-दूसरे से जुड़ी कई प्रसंस्करण इकाइयाँ होती हैं। निम्नलिखित कृत्रिम तंत्रिका नेटवर्क का योजनाबद्ध प्रतिनिधित्व है -

आरेख दिखाता है कि छिपी हुई इकाइयाँ बाहरी परत के साथ संचार करती हैं। जबकि इनपुट और आउटपुट यूनिट नेटवर्क की छिपी हुई परत के माध्यम से ही संवाद करते हैं।

नोड्स के साथ कनेक्शन का पैटर्न, परतों की कुल संख्या और इनपुट्स और आउटपुट के बीच नोड्स का स्तर प्रति परत न्यूरॉन्स की संख्या के साथ एक तंत्रिका नेटवर्क की वास्तुकला को परिभाषित करता है।

वास्तुकला दो प्रकार की होती है। इस प्रकार की कार्यक्षमता कृत्रिम तंत्रिका नेटवर्क पर केंद्रित है -

  • सिंगल लेयर परसेप्ट्रॉन
  • मल्टी-लेयर परसेप्ट्रॉन

सिंगल लेयर परसेप्ट्रॉन

सिंगल लेयर परसेप्ट्रॉन पहला प्रस्तावित न्यूरल मॉडल है। न्यूरॉन की स्थानीय मेमोरी की सामग्री में वेट का एक वेक्टर होता है। सिंगल लेयर परसेप्ट्रान की गणना प्रत्येक इनपुट वेक्टर के योग की गणना के साथ की जाती है, जो कि वेट के वेक्टर के संबंधित तत्व से गुणा मूल्य के साथ होता है। आउटपुट में जो मूल्य प्रदर्शित किया जाता है वह एक सक्रियण फ़ंक्शन का इनपुट होगा।

आइए हम TensorFlow का उपयोग करके एक छवि वर्गीकरण समस्या के लिए सिंगल लेयर पर्सेप्ट्रॉन के कार्यान्वयन पर ध्यान दें। एकल परत अवधारणात्मक का वर्णन करने के लिए सबसे अच्छा उदाहरण "लॉजिस्टिक रिग्रेशन" का प्रतिनिधित्व है।

अब, आइए हम लॉजिस्टिक प्रतिगमन प्रशिक्षण के निम्नलिखित बुनियादी चरणों पर विचार करें -

  • भार प्रशिक्षण की शुरुआत में यादृच्छिक मूल्यों के साथ आरंभ किया जाता है।

  • प्रशिक्षण सेट के प्रत्येक तत्व के लिए, त्रुटि की गणना वांछित आउटपुट और वास्तविक आउटपुट के बीच अंतर के साथ की जाती है। गणना की गई त्रुटि का उपयोग वजन को समायोजित करने के लिए किया जाता है।

  • यह प्रक्रिया तब तक दोहराई जाती है जब तक कि पूरे प्रशिक्षण सेट पर की गई त्रुटि निर्दिष्ट सीमा से कम न हो, जब तक कि पुनरावृत्तियों की अधिकतम संख्या न पहुँच जाए।

लॉजिस्टिक रिग्रेशन के मूल्यांकन के लिए पूरा कोड नीचे दिया गया है -

# Import MINST data 
from tensorflow.examples.tutorials.mnist import input_data 
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True) 

import tensorflow as tf 
import matplotlib.pyplot as plt 

# Parameters 
learning_rate = 0.01 
training_epochs = 25 
batch_size = 100 
display_step = 1 

# tf Graph Input 
x = tf.placeholder("float", [None, 784]) # mnist data image of shape 28*28 = 784 
y = tf.placeholder("float", [None, 10]) # 0-9 digits recognition => 10 classes 

# Create model 
# Set model weights 
W = tf.Variable(tf.zeros([784, 10])) 
b = tf.Variable(tf.zeros([10])) 

# Construct model 
activation = tf.nn.softmax(tf.matmul(x, W) + b) # Softmax 

# Minimize error using cross entropy 
cross_entropy = y*tf.log(activation) 
cost = tf.reduce_mean\ (-tf.reduce_sum\ (cross_entropy,reduction_indices = 1)) 

optimizer = tf.train.\ GradientDescentOptimizer(learning_rate).minimize(cost) 

#Plot settings 
avg_set = [] 
epoch_set = [] 

# Initializing the variables init = tf.initialize_all_variables()
# Launch the graph 
with tf.Session() as sess:
   sess.run(init)
   
   # Training cycle
   for epoch in range(training_epochs):
      avg_cost = 0.
      total_batch = int(mnist.train.num_examples/batch_size)
      
      # Loop over all batches
      for i in range(total_batch):
         batch_xs, batch_ys = \ mnist.train.next_batch(batch_size)
         # Fit training using batch data sess.run(optimizer, \ feed_dict = {
            x: batch_xs, y: batch_ys}) 
         # Compute average loss avg_cost += sess.run(cost, \ feed_dict = {
            x: batch_xs, \ y: batch_ys})/total_batch
      # Display logs per epoch step
      if epoch % display_step == 0:
         print ("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(avg_cost))
            avg_set.append(avg_cost) epoch_set.append(epoch+1)
   print ("Training phase finished")
    
   plt.plot(epoch_set,avg_set, 'o', label = 'Logistic Regression Training phase') 
   plt.ylabel('cost') 
   plt.xlabel('epoch') 
   plt.legend() 
   plt.show() 
    
   # Test model 
   correct_prediction = tf.equal(tf.argmax(activation, 1), tf.argmax(y, 1)) 
   
   # Calculate accuracy 
   accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) print 
      ("Model accuracy:", accuracy.eval({x: mnist.test.images, y: mnist.test.labels}))

उत्पादन

उपरोक्त कोड निम्नलिखित आउटपुट उत्पन्न करता है -

लॉजिस्टिक रिग्रेशन को प्रेडिक्टिव एनालिसिस माना जाता है। लॉजिस्टिक रिग्रेशन का उपयोग डेटा का वर्णन करने और एक आश्रित बाइनरी चर और एक या अधिक नाममात्र या स्वतंत्र चर के बीच संबंधों को समझाने के लिए किया जाता है।