TensorFlow - संवादी तंत्रिका नेटवर्क
मशीन-सीखने की अवधारणाओं को समझने के बाद, हम अब अपना ध्यान गहरी सीखने की अवधारणाओं पर स्थानांतरित कर सकते हैं। डीप लर्निंग मशीन लर्निंग का एक प्रभाग है और इसे हाल के दशकों में शोधकर्ताओं द्वारा उठाया गया एक महत्वपूर्ण कदम माना जाता है। गहन शिक्षण कार्यान्वयन के उदाहरणों में छवि मान्यता और भाषण मान्यता जैसे अनुप्रयोग शामिल हैं।
निम्नलिखित दो महत्वपूर्ण प्रकार के गहरे तंत्रिका नेटवर्क हैं -
- संवादी तंत्रिका नेटवर्क
- आवर्तक तंत्रिका नेटवर्क
इस अध्याय में, हम CNN, संकेंद्रित तंत्रिका नेटवर्क पर ध्यान केंद्रित करेंगे।
संवादी तंत्रिका नेटवर्क
कन्वर्सेशनल न्यूरल नेटवर्क को एरे की कई परतों के माध्यम से डेटा को प्रोसेस करने के लिए डिज़ाइन किया गया है। इस प्रकार के न्यूरल नेटवर्क का उपयोग इमेज रिकॉग्निशन या फेस रिकग्निशन जैसे अनुप्रयोगों में किया जाता है। सीएनएन और किसी भी अन्य सामान्य तंत्रिका नेटवर्क के बीच प्राथमिक अंतर यह है कि सीएनएन एक दो-आयामी सरणी के रूप में इनपुट लेता है और फीचर निष्कर्षण पर ध्यान केंद्रित करने के बजाय छवियों पर सीधे संचालित होता है जो अन्य तंत्रिका नेटवर्क पर ध्यान केंद्रित करते हैं।
सीएनएन के प्रमुख दृष्टिकोण में मान्यता की समस्याओं के समाधान शामिल हैं। Google और Facebook जैसी शीर्ष कंपनियों ने मान्यता परियोजनाओं के लिए अनुसंधान और विकास में निवेश किया है ताकि अधिक गति के साथ गतिविधियां हो सकें।
एक दृढ़ तंत्रिका नेटवर्क तीन बुनियादी विचारों का उपयोग करता है -
- स्थानीय संबंधित क्षेत्र
- Convolution
- Pooling
आइये इन विचारों को विस्तार से समझते हैं।
सीएनएन स्थानिक सहसंबंधों का उपयोग करता है जो इनपुट डेटा के भीतर मौजूद हैं। तंत्रिका नेटवर्क की प्रत्येक समवर्ती परत कुछ इनपुट न्यूरॉन्स को जोड़ती है। इस विशिष्ट क्षेत्र को स्थानीय ग्रहणशील क्षेत्र कहा जाता है। स्थानीय ग्रहणशील क्षेत्र छिपे हुए न्यूरॉन्स पर ध्यान केंद्रित करता है। छिपे हुए न्यूरॉन्स विशिष्ट सीमा के बाहर परिवर्तनों को साकार नहीं करते हुए उल्लेखित क्षेत्र के अंदर इनपुट डेटा को संसाधित करते हैं।
निम्नलिखित स्थानीय संबंधित क्षेत्रों को उत्पन्न करने का एक आरेखीय प्रतिनिधित्व है -
यदि हम उपरोक्त प्रतिनिधित्व का निरीक्षण करते हैं, तो प्रत्येक कनेक्शन एक परत से दूसरी परत के साथ जुड़े हुए कनेक्शन के साथ छिपे हुए न्यूरॉन का एक भार सीखता है। यहां, व्यक्तिगत न्यूरॉन्स समय-समय पर एक बदलाव करते हैं। इस प्रक्रिया को "कनविक्शन" कहा जाता है।
इनपुट परत से छिपे हुए फीचर मैप में कनेक्शन की मैपिंग को "साझा भार" के रूप में परिभाषित किया गया है और इसमें शामिल पूर्वाग्रह को "साझा पूर्वाग्रह" कहा जाता है।
CNN या कन्वेन्शनल न्यूरल नेटवर्क पूलिंग लेयर्स का उपयोग करते हैं, जो कि लेयर हैं, CNN डिक्लेरेशन के तुरंत बाद पोस्ट की जाती हैं। यह उपयोगकर्ता से इनपुट को एक फ़ीचर मैप के रूप में लेता है जो कनवल्शन नेटवर्क से निकलता है और एक कंडेंस्ड फ़ीचर मैप तैयार करता है। पूलिंग परतें पिछली परतों के न्यूरॉन्स के साथ परत बनाने में मदद करती हैं।
TensorFlow CNN का कार्यान्वयन
इस खंड में, हम CNN के TensorFlow कार्यान्वयन के बारे में जानेंगे। संपूर्ण नेटवर्क के निष्पादन और उचित आयाम की आवश्यकता वाले कदम निम्नानुसार हैं -
Step 1 - TensorFlow के लिए आवश्यक मॉड्यूल और डेटा सेट मॉड्यूल शामिल करें, जिन्हें CNN मॉडल की गणना करने की आवश्यकता होती है।
import tensorflow as tf
import numpy as np
from tensorflow.examples.tutorials.mnist import input_data
Step 2 - नामक एक समारोह की घोषणा run_cnn(), जिसमें डेटा प्लेसहोल्डर की घोषणा के साथ विभिन्न पैरामीटर और अनुकूलन चर शामिल हैं। ये अनुकूलन चर प्रशिक्षण पैटर्न की घोषणा करेंगे।
def run_cnn():
mnist = input_data.read_data_sets("MNIST_data/", one_hot = True)
learning_rate = 0.0001
epochs = 10
batch_size = 50
Step 3 - इस चरण में, हम इनपुट मापदंडों के साथ प्रशिक्षण डेटा प्लेसहोल्डर्स की घोषणा करेंगे - 28 x 28 पिक्सल = 784 के लिए। यह चपटा छवि डेटा है जो इससे खींचा गया है mnist.train.nextbatch()।
हम अपनी आवश्यकताओं के अनुसार टेंसर को फिर से खोल सकते हैं। पहला मान (-1) फ़ंक्शन को गतिशील रूप से आकार देने के लिए कहता है जो कि उस पर दिए गए डेटा की मात्रा के आधार पर आयाम है। दो मध्य आयाम छवि आकार (यानी 28 x 28) पर सेट हैं।
x = tf.placeholder(tf.float32, [None, 784])
x_shaped = tf.reshape(x, [-1, 28, 28, 1])
y = tf.placeholder(tf.float32, [None, 10])
Step 4 - अब कुछ महत्वपूर्ण परतें बनाना महत्वपूर्ण है -
layer1 = create_new_conv_layer(x_shaped, 1, 32, [5, 5], [2, 2], name = 'layer1')
layer2 = create_new_conv_layer(layer1, 32, 64, [5, 5], [2, 2], name = 'layer2')
Step 5- हम पूरी तरह से जुड़े आउटपुट चरण के लिए तैयार आउटपुट को समतल करते हैं - 28 x 28 के आयामों के साथ 2 पूलिंग की दो परतों के बाद, 14 x 14 या न्यूनतम 7 x 7 x के आयाम के लिए, y सह-निर्देशांक, लेकिन 64 के साथ आउटपुट चैनल। "घने" परत के साथ पूरी तरह से जुड़ा हुआ बनाने के लिए, नए आकार को [-1, 7 x 7 x 64] होना चाहिए। हम इस परत के लिए कुछ वज़न और पूर्वाग्रह मान सेट कर सकते हैं, फिर ReLU के साथ सक्रिय कर सकते हैं।
flattened = tf.reshape(layer2, [-1, 7 * 7 * 64])
wd1 = tf.Variable(tf.truncated_normal([7 * 7 * 64, 1000], stddev = 0.03), name = 'wd1')
bd1 = tf.Variable(tf.truncated_normal([1000], stddev = 0.01), name = 'bd1')
dense_layer1 = tf.matmul(flattened, wd1) + bd1
dense_layer1 = tf.nn.relu(dense_layer1)
Step 6 - आवश्यक ऑप्टिमाइज़र के साथ विशिष्ट सॉफ्टमैक्स सक्रियण के साथ एक और परत सटीकता मूल्यांकन को परिभाषित करती है, जो आरंभीकरण ऑपरेटर का सेटअप बनाती है।
wd2 = tf.Variable(tf.truncated_normal([1000, 10], stddev = 0.03), name = 'wd2')
bd2 = tf.Variable(tf.truncated_normal([10], stddev = 0.01), name = 'bd2')
dense_layer2 = tf.matmul(dense_layer1, wd2) + bd2
y_ = tf.nn.softmax(dense_layer2)
cross_entropy = tf.reduce_mean(
tf.nn.softmax_cross_entropy_with_logits(logits = dense_layer2, labels = y))
optimiser = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
init_op = tf.global_variables_initializer()
Step 7- हमें रिकॉर्डिंग चर सेट करना चाहिए। यह डेटा की सटीकता को संग्रहीत करने के लिए एक सारांश जोड़ता है।
tf.summary.scalar('accuracy', accuracy)
merged = tf.summary.merge_all()
writer = tf.summary.FileWriter('E:\TensorFlowProject')
with tf.Session() as sess:
sess.run(init_op)
total_batch = int(len(mnist.train.labels) / batch_size)
for epoch in range(epochs):
avg_cost = 0
for i in range(total_batch):
batch_x, batch_y = mnist.train.next_batch(batch_size = batch_size)
_, c = sess.run([optimiser, cross_entropy], feed_dict = {
x:batch_x, y: batch_y})
avg_cost += c / total_batch
test_acc = sess.run(accuracy, feed_dict = {x: mnist.test.images, y:
mnist.test.labels})
summary = sess.run(merged, feed_dict = {x: mnist.test.images, y:
mnist.test.labels})
writer.add_summary(summary, epoch)
print("\nTraining complete!")
writer.add_graph(sess.graph)
print(sess.run(accuracy, feed_dict = {x: mnist.test.images, y:
mnist.test.labels}))
def create_new_conv_layer(
input_data, num_input_channels, num_filters,filter_shape, pool_shape, name):
conv_filt_shape = [
filter_shape[0], filter_shape[1], num_input_channels, num_filters]
weights = tf.Variable(
tf.truncated_normal(conv_filt_shape, stddev = 0.03), name = name+'_W')
bias = tf.Variable(tf.truncated_normal([num_filters]), name = name+'_b')
#Out layer defines the output
out_layer =
tf.nn.conv2d(input_data, weights, [1, 1, 1, 1], padding = 'SAME')
out_layer += bias
out_layer = tf.nn.relu(out_layer)
ksize = [1, pool_shape[0], pool_shape[1], 1]
strides = [1, 2, 2, 1]
out_layer = tf.nn.max_pool(
out_layer, ksize = ksize, strides = strides, padding = 'SAME')
return out_layer
if __name__ == "__main__":
run_cnn()
निम्नलिखित कोड द्वारा उत्पन्न आउटपुट है -
See @{tf.nn.softmax_cross_entropy_with_logits_v2}.
2018-09-19 17:22:58.802268: I
T:\src\github\tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:140]
Your CPU supports instructions that this TensorFlow binary was not compiled to
use: AVX2
2018-09-19 17:25:41.522845: W
T:\src\github\tensorflow\tensorflow\core\framework\allocator.cc:101] Allocation
of 1003520000 exceeds 10% of system memory.
2018-09-19 17:25:44.630941: W
T:\src\github\tensorflow\tensorflow\core\framework\allocator.cc:101] Allocation
of 501760000 exceeds 10% of system memory.
Epoch: 1 cost = 0.676 test accuracy: 0.940
2018-09-19 17:26:51.987554: W
T:\src\github\tensorflow\tensorflow\core\framework\allocator.cc:101] Allocation
of 1003520000 exceeds 10% of system memory.