PyTorch - तंत्रिका नेटवर्क मूल बातें

तंत्रिका नेटवर्क के मुख्य सिद्धांत में मूल तत्वों का एक संग्रह शामिल है, अर्थात, कृत्रिम न्यूरॉन या परसेप्ट्रॉन। इसमें कई मूल इनपुट शामिल हैं जैसे कि X1, x2… .. xn जो बाइनरी आउटपुट का उत्पादन करता है यदि राशि सक्रियण क्षमता से अधिक है।

नमूना न्यूरॉन का योजनाबद्ध प्रतिनिधित्व नीचे उल्लेखित है -

उत्पन्न आउटपुट को सक्रियण क्षमता या पूर्वाग्रह के साथ भारित योग माना जा सकता है।

$$ आउटपुट = \ sum_jw_jx_j + पूर्वाग्रह $$

ठेठ तंत्रिका नेटवर्क वास्तुकला नीचे वर्णित है -

इनपुट और आउटपुट के बीच की परतों को छिपी हुई परतों के रूप में जाना जाता है, और परतों के बीच घनत्व और प्रकार के कनेक्शन कॉन्फ़िगरेशन हैं। उदाहरण के लिए, एक पूरी तरह से जुड़े कॉन्फ़िगरेशन में L + 1 से जुड़े लेयर L के सभी न्यूरॉन्स होते हैं। अधिक स्पष्ट स्थानीयकरण के लिए, हम केवल एक स्थानीय पड़ोस को जोड़ सकते हैं, अगली परत तक, नौ न्यूरॉन्स कह सकते हैं। चित्र 1-9 घने कनेक्शन के साथ दो छिपी हुई परतों को दिखाता है।

तंत्रिका नेटवर्क के विभिन्न प्रकार इस प्रकार हैं -

फीडफॉर्वर्ड न्यूरल नेटवर्क

Feedforward तंत्रिका नेटवर्क में तंत्रिका नेटवर्क परिवार की बुनियादी इकाइयां शामिल हैं। इस प्रकार के तंत्रिका नेटवर्क में डेटा की गति इनपुट परत से आउटपुट परत तक, वर्तमान छिपी परतों के माध्यम से होती है। एक परत का आउटपुट नेटवर्क आर्किटेक्चर में किसी भी तरह के लूप पर प्रतिबंध के साथ इनपुट लेयर के रूप में कार्य करता है।

आवर्तक तंत्रिका नेटवर्क

आवर्तक तंत्रिका नेटवर्क तब होते हैं जब एक अवधि में डेटा पैटर्न में परिवर्तन होता है। आरएनएन में, एक ही परत को इनपुट मापदंडों को स्वीकार करने और निर्दिष्ट तंत्रिका नेटवर्क में आउटपुट मापदंडों को प्रदर्शित करने के लिए लागू किया जाता है।

Torch.nn पैकेज का उपयोग करके तंत्रिका नेटवर्क का निर्माण किया जा सकता है।

यह एक साधारण फीड-फ़ॉरवर्ड नेटवर्क है। यह इनपुट लेता है, एक के बाद एक कई परतों के माध्यम से इसे खिलाता है, और फिर अंत में आउटपुट देता है।

PyTorch की सहायता से, हम तंत्रिका नेटवर्क के लिए विशिष्ट प्रशिक्षण प्रक्रिया के लिए निम्नलिखित चरणों का उपयोग कर सकते हैं -

  • तंत्रिका नेटवर्क को परिभाषित करें जिसमें कुछ सीखने योग्य पैरामीटर (या वजन) हैं।
  • इनपुट के डेटासेट पर Iterate करें।
  • नेटवर्क के माध्यम से प्रक्रिया इनपुट।
  • नुकसान की गणना करें (सही होने से आउटपुट कितना दूर है)।
  • ग्रेडिएंट्स को नेटवर्क के मापदंडों में वापस लाएं।
  • आमतौर पर नीचे दिए गए अनुसार एक साधारण अद्यतन का उपयोग करके, नेटवर्क के वजन को अपडेट करें
rule: weight = weight -learning_rate * gradient