PyTorch - संवादी तंत्रिका नेटवर्क

डीप लर्निंग मशीन लर्निंग का एक प्रभाग है और इसे हाल के दशकों में शोधकर्ताओं द्वारा उठाया गया एक महत्वपूर्ण कदम माना जाता है। गहन शिक्षण कार्यान्वयन के उदाहरणों में छवि मान्यता और भाषण मान्यता जैसे अनुप्रयोग शामिल हैं।

दो महत्वपूर्ण प्रकार के गहरे तंत्रिका नेटवर्क नीचे दिए गए हैं -

  • संवादी तंत्रिका नेटवर्क
  • आवर्तक तंत्रिका नेटवर्क।

इस अध्याय में, हम पहले प्रकार पर ध्यान केंद्रित करेंगे, अर्थात, कन्वर्सेशनल न्यूरल नेटवर्क्स (CNN)।

संवादी तंत्रिका नेटवर्क

कन्वर्सेशनल न्यूरल नेटवर्क को एरे की कई परतों के माध्यम से डेटा को प्रोसेस करने के लिए डिज़ाइन किया गया है। इस प्रकार के तंत्रिका नेटवर्क का उपयोग छवि पहचान या चेहरा पहचान जैसे अनुप्रयोगों में किया जाता है।

सीएनएन और किसी भी अन्य सामान्य तंत्रिका नेटवर्क के बीच प्राथमिक अंतर यह है कि सीएनएन एक दो आयामी सरणी के रूप में इनपुट लेता है और फीचर निष्कर्षण पर ध्यान केंद्रित करने के बजाय छवियों पर सीधे संचालित होता है जो अन्य तंत्रिका नेटवर्क पर ध्यान केंद्रित करते हैं।

सीएनएन के प्रमुख दृष्टिकोण में मान्यता की समस्याओं का समाधान शामिल है। Google और फेसबुक जैसी शीर्ष कंपनियों ने मान्यता परियोजनाओं के अनुसंधान और विकास परियोजनाओं में निवेश किया है ताकि अधिक गति के साथ गतिविधियां हो सकें।

हर दृढ़ तंत्रिका नेटवर्क में तीन मूल विचार शामिल हैं -

  • स्थानीय संबंधित क्षेत्र
  • Convolution
  • Pooling

आइए हम इनमें से प्रत्येक शब्दावली को विस्तार से समझें।

स्थानीय प्रतिक्रियाशील क्षेत्र

सीएनएन स्थानिक सहसंबंधों का उपयोग करता है जो इनपुट डेटा के भीतर मौजूद हैं। तंत्रिका नेटवर्क के समवर्ती परतों में प्रत्येक कुछ इनपुट न्यूरॉन्स के जोड़ता है। इस विशिष्ट क्षेत्र को स्थानीय ग्रहणशील क्षेत्र कहा जाता है। यह केवल छिपे हुए न्यूरॉन्स पर ध्यान केंद्रित करता है। छिपे हुए न्यूरॉन निर्दिष्ट सीमा के बाहर परिवर्तनों को साकार नहीं करते हुए उल्लेखित क्षेत्र के अंदर इनपुट डेटा को संसाधित करेंगे।

स्थानीय संबंधित क्षेत्रों को उत्पन्न करने का चित्रण प्रतिनिधित्व नीचे दिया गया है -

कनवल्शन

उपरोक्त आंकड़े में, हम मानते हैं कि प्रत्येक कनेक्शन एक परत से दूसरी परत के साथ जुड़े हुए कनेक्शन के साथ छिपे हुए न्यूरॉन का एक भार सीखता है। यहां, व्यक्तिगत न्यूरॉन्स समय-समय पर एक बदलाव करते हैं। इस प्रक्रिया को "कनविक्शन" कहा जाता है।

इनपुट परत से छिपे हुए फीचर मैप में कनेक्शन की मैपिंग को "साझा भार" के रूप में परिभाषित किया गया है और इसमें शामिल पूर्वाग्रह को "साझा पूर्वाग्रह" कहा जाता है।

पूलिंग

संवैधानिक तंत्रिका नेटवर्क पूलिंग परतों का उपयोग करते हैं जो सीएनएन घोषणा के तुरंत बाद तैनात होते हैं। यह उपयोगकर्ता से इनपुट को एक फीचर मैप के रूप में लेता है जो कंसेंट नेटवर्क से बाहर आता है और एक कंडेंस्ड फीचर मैप तैयार करता है। पूलिंग परतें पिछली परतों के न्यूरॉन्स के साथ परत बनाने में मदद करती हैं।

PyTorch का कार्यान्वयन

PyTorch का उपयोग करके एक कन्वर्नल न्यूरल नेटवर्क बनाने के लिए निम्न चरणों का उपयोग किया जाता है।

चरण 1

एक सरल तंत्रिका नेटवर्क बनाने के लिए आवश्यक पैकेज आयात करें।

from torch.autograd import Variable
import torch.nn.functional as F

चरण 2

सजातीय तंत्रिका नेटवर्क के बैच प्रतिनिधित्व के साथ एक वर्ग बनाएं। इनपुट x के लिए हमारे बैच का आकार (3, 32, 32) के आयाम के साथ है।

class SimpleCNN(torch.nn.Module):
   def __init__(self):
      super(SimpleCNN, self).__init__()
      #Input channels = 3, output channels = 18
      self.conv1 = torch.nn.Conv2d(3, 18, kernel_size = 3, stride = 1, padding = 1)
      self.pool = torch.nn.MaxPool2d(kernel_size = 2, stride = 2, padding = 0)
      #4608 input features, 64 output features (see sizing flow below)
      self.fc1 = torch.nn.Linear(18 * 16 * 16, 64)
      #64 input features, 10 output features for our 10 defined classes
      self.fc2 = torch.nn.Linear(64, 10)

चरण 3

(3, 32, 32) से (18, 32, 32) में पहले कनवल्शन साइज़ के परिवर्तनों की सक्रियता की गणना करें।

आयाम का आकार (18, 32, 32) से (18, 16, 16) बदल जाता है। तंत्रिका जाल की इनपुट परत का डेटा आयाम फिर से सेट करें जिसके कारण आकार (18, 16, 16) से (1, 4608) में बदल जाता है।

स्मरण करो कि -1 इस आयाम को दूसरे दिए गए आयाम से प्रभावित करता है।

def forward(self, x):
   x = F.relu(self.conv1(x))
   x = self.pool(x)
   x = x.view(-1, 18 * 16 *16)
   x = F.relu(self.fc1(x))
   #Computes the second fully connected layer (activation applied later)
   #Size changes from (1, 64) to (1, 10)
   x = self.fc2(x)
   return(x)