पर्यवेक्षित अध्ययन

जैसा कि नाम सुझाव देता है, supervised learningएक शिक्षक की देखरेख में होता है। यह सीखने की प्रक्रिया निर्भर है। पर्यवेक्षित शिक्षण के तहत एएनएन के प्रशिक्षण के दौरान, इनपुट वेक्टर नेटवर्क को प्रस्तुत किया जाता है, जो एक आउटपुट वेक्टर का उत्पादन करेगा। इस आउटपुट वेक्टर की तुलना वांछित / लक्ष्य आउटपुट वेक्टर से की जाती है। यदि वास्तविक आउटपुट और वांछित / लक्ष्य आउटपुट वेक्टर के बीच अंतर है, तो एक त्रुटि संकेत उत्पन्न होता है। इस त्रुटि संकेत के आधार पर, वजन तब तक समायोजित किया जाएगा जब तक कि वास्तविक आउटपुट वांछित आउटपुट के साथ मेल नहीं खाता।

perceptron

फ्रेंक रोसेनब्लट द्वारा मैककुलोच और पिट्स मॉडल का उपयोग करके विकसित किया गया है, परसेप्ट्रॉन कृत्रिम तंत्रिका नेटवर्क की बुनियादी परिचालन इकाई है। यह पर्यवेक्षित शिक्षण नियम को नियोजित करता है और डेटा को दो वर्गों में वर्गीकृत करने में सक्षम है।

परसेप्ट्रॉन की परिचालन विशेषताएं: इसमें एक एकल न्यूरॉन होता है, जिसमें समायोज्य वजन के साथ-साथ इनपुट की एक मनमानी संख्या होती है, लेकिन थ्रेशोल्ड के आधार पर न्यूरॉन का उत्पादन 1 या 0 होता है। इसमें एक पूर्वाग्रह भी होता है जिसका वजन हमेशा 1 होता है। निम्नलिखित आकृति परसेप्ट्रान का एक योजनाबद्ध प्रतिनिधित्व देती है।

इस प्रकार परसेप्ट्रोन में निम्नलिखित तीन मूल तत्व होते हैं -

  • Links - इसमें कनेक्शन लिंक का एक सेट होगा, जिसमें एक पूर्वाग्रह सहित वजन होता है जिसमें हमेशा वजन 1 होता है।

  • Adder - यह इनपुट को उनके संबंधित भार से गुणा करने के बाद जोड़ता है।

  • Activation function- यह न्यूरॉन के उत्पादन को सीमित करता है। सबसे बुनियादी सक्रियण फ़ंक्शन एक हैविसाइड चरण फ़ंक्शन है जिसमें दो संभावित आउटपुट हैं। यह फ़ंक्शन 1 रिटर्न देता है, यदि इनपुट सकारात्मक है, और किसी भी नकारात्मक इनपुट के लिए 0 है।

प्रशिक्षण एल्गोरिथ्म

Perceptron नेटवर्क को एकल आउटपुट इकाई के साथ-साथ कई आउटपुट इकाइयों के लिए प्रशिक्षित किया जा सकता है।

एकल आउटपुट यूनिट के लिए प्रशिक्षण एल्गोरिथम

Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -

  • Weights
  • Bias
  • लर्निंग दर $ \ अल्फा $

आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।

Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।

Step 3 - हर प्रशिक्षण वेक्टर के लिए चरण 4-6 जारी रखें x

Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -

$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$

Step 5 - अब निम्नलिखित संबंध के साथ शुद्ध इनपुट प्राप्त करें -

$ $ y_ {in} \: = \: b \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i}। \: w_ {i} $।

यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।

Step 6 - अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें।

$$ f (y_ {in}) \: = \: \ start {case} 1 और if \: y_ {in} \ _: \ _ \ _ theta \\ 0 और if \: - \ theta \: \ leqslive \ _ : y_ {in} \: \ leqslant \: \ theta \\ - 1 & if \: y_ {in} \: <\: - \ theta \ end {मामले} $ $

Step 7 - वजन और पूर्वाग्रह को निम्नानुसार समायोजित करें -

Case 1 - अगर y ≠ t फिर,

$$ w_ {मैं} (नया) \: = \: w_ {मैं} (पुराने) \: + \: \ अल्फा \: tx_ {मैं} $$

$ $ b (नया) \: = \: बी (पुराना) \: + \: \ अल्फा टी $ $

Case 2 - अगर y = t फिर,

$$ w_ {मैं} (नया) \: = \: w_ {मैं} (पुराने) $$

$$ ख (नया) \: = \: ख (पुराने) $$

यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।

Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होता है जब वजन में कोई बदलाव नहीं होता है।

एकाधिक आउटपुट इकाइयों के लिए प्रशिक्षण एल्गोरिथ्म

निम्नलिखित आरेख कई आउटपुट कक्षाओं के लिए अवधारणात्मक की वास्तुकला है।

Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -

  • Weights
  • Bias
  • लर्निंग दर $ \ अल्फा $

आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।

Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।

Step 3 - हर प्रशिक्षण वेक्टर के लिए चरण 4-6 जारी रखें x

Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -

$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$

Step 5 - निम्नलिखित संबंध के साथ शुद्ध इनपुट प्राप्त करें -

$$ y_ {in} \: = \: b \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i} \: w_ {ij} $$

यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।

Step 6 - प्रत्येक आउटपुट यूनिट के लिए अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें j = 1 to m -

$$ f (y_ {in}) \: = \: \ start {मामलों} 1 & if \: y_ {घायल} \ _: \ _ \ _ थीटा \\ 0 और अगर \: - \ थीटा \: \ leqslive \ " : y_ {घायल} \: \ leqslant \: \ theta \\ - 1 और if \: y_ {घायल} \: <\: - \ theta \ end {मामले} $ $

Step 7 - के लिए वजन और पूर्वाग्रह समायोजित करें x = 1 to n तथा j = 1 to m निम्नानुसार है -

Case 1 - अगर yj ≠ tj फिर,

$$ w_ {ij} (नया) \: = \: w_ {ij} (पुराने) \: + \: \ अल्फा \: T_ {j} x_ {मैं} $$

$ $ b_ {j} (नया) \: = \: b_ {j} (पुराना) \: + \: \ अल्फा t_ {j} $ $

Case 2 - अगर yj = tj फिर,

$$ w_ {ij} (नया) \: = \: w_ {ij} (पुराने) $$

$$ b_ {j} (नया) \: = \: b_ {j} (पुराने) $$

यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।

Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होगा जब वजन में कोई बदलाव नहीं होगा।

अनुकूली रैखिक न्यूरॉन (एडलिन)

Adaline जो Adaptive Linear Neuron के लिए खड़ा है, एक एकल रैखिक इकाई वाला एक नेटवर्क है। यह 1960 में विडो और हॉफ द्वारा विकसित किया गया था। एडालिन के बारे में कुछ महत्वपूर्ण बिंदु इस प्रकार हैं -

  • यह द्विध्रुवी सक्रियण फ़ंक्शन का उपयोग करता है।

  • यह प्रशिक्षण के लिए वास्तविक उत्पादन और वांछित / लक्ष्य आउटपुट के बीच मीन-चुकता त्रुटि (MSE) को कम करने के लिए डेल्टा नियम का उपयोग करता है।

  • वजन और पूर्वाग्रह समायोज्य हैं।

आर्किटेक्चर

Adaline की मूल संरचना अवधारणात्मक के समान है, जिसकी सहायता से एक अतिरिक्त फीडबैक लूप मिलता है जिसकी मदद से वांछित / लक्ष्य आउटपुट के साथ वास्तविक आउटपुट की तुलना की जाती है। प्रशिक्षण एल्गोरिथ्म के आधार पर तुलना के बाद, वज़न और पूर्वाग्रह को अपडेट किया जाएगा।

प्रशिक्षण एल्गोरिथ्म

Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -

  • Weights
  • Bias
  • लर्निंग दर $ \ अल्फा $

आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।

Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।

Step 3 - हर द्विध्रुवी प्रशिक्षण जोड़ी के लिए चरण 4-6 जारी रखें s:t

Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -

$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$

Step 5 - निम्नलिखित संबंध के साथ शुद्ध इनपुट प्राप्त करें -

$$ y_ {in} \: = \: b \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i} \: w_ {i} $ $

यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।

Step 6 - अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें -

$$ f (y_ {in}) \: = \: \ start {case} 1 & if \: y_ {in} \: \ geqslant \: 0 \\ - 1 और if \: y_ {in} \ <> \ _ 0 \ end {मामले} $ $

Step 7 - वजन और पूर्वाग्रह को निम्नानुसार समायोजित करें -

Case 1 - अगर y ≠ t फिर,

$ $ w_ {i} (नया) \: = \: w_ {i} (पुराना) \: + \: \ अल्फा (t \: - \: y_ {in}) x_ {i} $ $

$ $ b (नया) \: = \: बी (पुराना) \: + \: \ अल्फा (टी \: - \: y_ {in}) $ $

Case 2 - अगर y = t फिर,

$$ w_ {मैं} (नया) \: = \: w_ {मैं} (पुराने) $$

$$ ख (नया) \: = \: ख (पुराने) $$

यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।

$ (t \: - \; y_ {in}) $ गणना की गई त्रुटि है।

Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होगा जब वजन में कोई बदलाव नहीं होता है या प्रशिक्षण के दौरान सबसे अधिक वजन में परिवर्तन निर्दिष्ट सहिष्णुता से छोटा होता है।

मल्टीपल अडैप्टिव लीनियर न्यूरॉन (मैडलीन)

मैडालीन जो कि कई एडेप्टिव लीनियर न्यूरॉन के लिए खड़ा है, एक नेटवर्क है जिसमें समानांतर में कई एडलीन होते हैं। इसकी एकल आउटपुट इकाई होगी। मैडलीन के बारे में कुछ महत्वपूर्ण बिंदु इस प्रकार हैं -

  • यह एक बहुपरत अवधारणात्मक की तरह है, जहां एडलिन इनपुट और मैडलिन परत के बीच एक छिपी इकाई के रूप में कार्य करेगा।

  • इनपुट और एडलीन परतों के बीच वजन और पूर्वाग्रह, जैसा कि हम एडलिन वास्तुकला में देखते हैं, समायोज्य हैं।

  • Adaline और Madaline परतों का वजन और पूर्वाग्रह 1 है।

  • डेल्टा नियम की सहायता से प्रशिक्षण प्राप्त किया जा सकता है।

आर्किटेक्चर

मैडलिन की वास्तुकला में शामिल हैं “n” इनपुट परत के न्यूरॉन्स, “m”Adaline लेयर के न्यूरॉन्स, और Madaline लेयर के 1 न्यूरॉन। Adaline लेयर को हिडन लेयर माना जा सकता है क्योंकि यह इनपुट लेयर और आउटपुट लेयर यानी Madaline लेयर के बीच होती है।

प्रशिक्षण एल्गोरिथ्म

अब तक हम जानते हैं कि इनपुट और एडलीन परत के बीच केवल वज़न और पूर्वाग्रह को समायोजित किया जाना है, और एडालीन और मैडलाइन परत के बीच के वज़न और पूर्वाग्रह तय हैं।

Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -

  • Weights
  • Bias
  • लर्निंग दर $ \ अल्फा $

आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।

Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।

Step 3 - हर द्विध्रुवी प्रशिक्षण जोड़ी के लिए चरण 4-6 जारी रखें s:t

Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -

$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$

Step 5 - प्रत्येक छिपी हुई परत पर शुद्ध इनपुट प्राप्त करें, अर्थात निम्नलिखित संबंध के साथ एडलिन परत -

$$ Q_ {घायल} \ _: = \ _ b_ {j} \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i} \: w_ {ij} \: \: \: j \ _ = \: 1 \: करने के लिए \: मीटर $$

यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।

Step 6 - Adaline और Madaline लेयर में अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें -

$ $ f (x) \: = \: \ शुरू {केस} 1 & if \: x \: \ geqslant \: 0 \\ - 1 और if \: x \: <\: 0 \ end {केस} $। $

छिपी हुई (एडालिन) इकाई में आउटपुट

$$ Q_ {j} \: = \: च (Q_ {इंज}) $$

नेटवर्क का अंतिम आउटपुट

$$ y \: = \: च ({} में y_) $$

i.e. $ \: \: y_ {घायल} \ _: = \: b_ {0} \: + \: \ sum_ {j = 1} ^ m \: Q_ {j} \: v_ {j} $

Step 7 - त्रुटि की गणना करें और निम्नानुसार वज़न समायोजित करें -

Case 1 - अगर y ≠ t तथा t = 1 फिर,

$ $ w_ {ij} (नया) \: = \: w_ {ij} (पुराना) \: + \: \ अल्फा (1 \: - \: Q_ {घायल}) x_ {i} $ $

$ $ b_ {j} (नया) \: = \: b_ {j} (पुराना) \: + \: \ अल्फा (1 \: - \: Q_ {घायल}) $ $

इस मामले में, वज़न को अपडेट किया जाएगा Qj जहां शुद्ध इनपुट 0 के करीब है क्योंकि t = 1

Case 2 - अगर y ≠ t तथा t = -1 फिर,

$ $ w_ {ik} (नया) \: = \: w_ {ik} (पुराना) \: + \: \ अल्फा (-1 \: - \: Q_ {स्याही}) x_ {i} $ $

$ $ b_ {k} (नया) \: = \: b_ {k} (पुराना) \: + \: \ अल्फा (-1 \: - \: Q_ {स्याही}) $ $

इस मामले में, वज़न को अपडेट किया जाएगा Qk जहां शुद्ध इनपुट सकारात्मक है क्योंकि t = -1

यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।

Case 3 - अगर y = t फिर

वज़न में कोई बदलाव नहीं होगा।

Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होगा जब वजन में कोई बदलाव नहीं होता है या प्रशिक्षण के दौरान सबसे अधिक वजन में परिवर्तन निर्दिष्ट सहिष्णुता से छोटा होता है।

वापस प्रसार तंत्रिका नेटवर्क

Back Propagation Neural (BPN) एक बहुपरत तंत्रिका नेटवर्क है जिसमें इनपुट परत होती है, कम से कम एक छिपी हुई परत और आउटपुट परत। जैसा कि इसके नाम से पता चलता है, इस नेटवर्क में बैक प्रोपेगेटिंग होगा। त्रुटि जो आउटपुट लेयर पर आंकी जाती है, लक्ष्य आउटपुट और वास्तविक आउटपुट की तुलना करके, इनपुट लेयर की ओर वापस प्रचारित होगी।

आर्किटेक्चर

जैसा कि चित्र में दिखाया गया है, BPN की वास्तुकला में तीन परस्पर परतें हैं, जिन पर भार होता है। छिपी हुई परत के साथ-साथ आउटपुट परत में भी पूर्वाग्रह होता है, जिसका वजन उन पर हमेशा 1 होता है। जैसा कि आरेख से स्पष्ट है, BPN का कार्य दो चरणों में होता है। एक चरण इनपुट लेयर से आउटपुट लेयर तक सिग्नल भेजता है, और दूसरा चरण आउटपुट लेयर से इनपुट लेयर तक त्रुटि को फैलाता है।

प्रशिक्षण एल्गोरिथ्म

प्रशिक्षण के लिए, बीपीएन बाइनरी सिग्मॉइड सक्रियण फ़ंक्शन का उपयोग करेगा। बीपीएन के प्रशिक्षण में निम्नलिखित तीन चरण होंगे।

  • Phase 1 - फीड फॉरवर्ड फेज

  • Phase 2 - त्रुटि का वापस प्रसार

  • Phase 3 - वजन का अद्यतन

इन सभी चरणों का समापन एल्गोरिथ्म में किया जाएगा

Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -

  • Weights
  • लर्निंग दर $ \ अल्फा $

आसान गणना और सरलता के लिए, कुछ छोटे यादृच्छिक मान लें।

Step 2 - स्टेप 3-11 तब जारी रखें जब रोक की स्थिति सही न हो।

Step 3 - हर प्रशिक्षण जोड़ी के लिए चरण 4-10 जारी रखें।

चरण 1

Step 4 - प्रत्येक इनपुट यूनिट को इनपुट सिग्नल मिलता है xi और इसे सभी के लिए छिपी इकाई को भेजता है i = 1 to n

Step 5 - निम्नलिखित संबंध का उपयोग करके छिपी इकाई में शुद्ध इनपुट की गणना करें -

$$ Q_ {घायल} \ _: = \ _ b_ {0j} \: + \: \ sum_ {i = 1} ^ n x_ {i} v_ {ij} \: \: \: \: j \: = \ _ : 1 \: करने के लिए \: p $$

यहाँ b0j छिपा इकाई पर पूर्वाग्रह है, vij पर वजन है j छिपी हुई परत की इकाई i इनपुट परत की इकाई।

अब निम्नलिखित सक्रियण फ़ंक्शन को लागू करके शुद्ध आउटपुट की गणना करें

$$ Q_ {j} \: = \: च (Q_ {इंज}) $$

छिपी परत इकाइयों के इन आउटपुट संकेतों को आउटपुट परत इकाइयों में भेजें।

Step 6 - निम्नलिखित संबंध का उपयोग करके आउटपुट परत इकाई में शुद्ध इनपुट की गणना करें -

$ $ y_ {स्याही} \: = \: b_ {0k} \: + \: \ sum_ {j = 1} ^ p \: Q_ {j} \: w_ {jk} \: \: k \: = \ _ : 1 \: करने के लिए \: मीटर $$

यहाँ b0k उत्पादन इकाई पर पूर्वाग्रह, wjk पर वजन है k से आने वाली आउटपुट लेयर की इकाई j छिपी हुई परत की इकाई।

निम्नलिखित सक्रियण फ़ंक्शन को लागू करके शुद्ध आउटपुट की गणना करें

$$ y_ {कश्मीर} \: = \: च (y_ {स्याही}) $$

2 चरण

Step 7 - प्रत्येक आउटपुट इकाई पर प्राप्त लक्ष्य पैटर्न के साथ पत्राचार में, त्रुटि सुधारक शब्द की गणना निम्नानुसार करें -

$$ \ delta_ {कश्मीर} \: = \ :( T_ {कश्मीर} \: - \: y_ {कश्मीर}) च ^ { '} (y_ {स्याही}) $$

इस आधार पर, वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करें -

$$ \ Delta v_ {jk} \: = \: \ Alpha \ delta_ {k} \: Q_ {i}} $ $

$$ \ Delta b_ {0k} \: = \: \ alp \ delta_ {k} $ $

फिर, छिपी हुई परत पर $ \ delta_ {k} $ वापस भेजें।

Step 8 - अब प्रत्येक छिपी इकाई आउटपुट इकाइयों से अपने डेल्टा इनपुट का योग होगी।

$$ \ delta_ {घायल} \ _: = \: \ displaystyle \ sum \ limit_ {k = 1} ^ m \ delta_ {k} \: w_ {jk} $$

त्रुटि शब्द की गणना निम्नानुसार की जा सकती है -

$$ \ delta_ {j} \: = \: \ delta_ {इंज} च ^ { '} (Q_ {इंज}) $$

इस आधार पर, वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करें -

$$ \ Delta w_ {ij} \: = \: \ alp \ delta_ {j} x_ {i} $ $

$$ \ Delta b_ {0j} \: = \: \ alp \ delta_ {j} $ $

चरण 3

Step 9 - प्रत्येक आउटपुट यूनिट (ykk = 1 to m) वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करता है -

$ $ v_ {jk} (नया) \: = \: v_ {jk} (पुराना) \: + \: \ Delta v_ {jk} $ $

$ $ b_ {0k} (नया) \: = \: b_ {0k} (पुराना) \: + \: \ Delta b_ {0k} $ $

Step 10 - प्रत्येक आउटपुट यूनिट (zjj = 1 to p) वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करता है -

$ $ w_ {ij} (नया) \: = \: w_ {ij} (पुराना) \: + \: \ Delta w_ {ij} $ $

$ $ b_ {0j} (नया) \: = \: b_ {0j} (पुराना) \: + \: \ Delta b_ {0j} $ $

Step 11 - रोकने की स्थिति के लिए जाँच करें, जो या तो पहुंच की संख्या तक पहुंच सकता है या लक्ष्य आउटपुट वास्तविक आउटपुट से मेल खाता है।

सामान्यीकृत डेल्टा लर्निंग नियम

डेल्टा नियम केवल आउटपुट लेयर के लिए काम करता है। दूसरी ओर, सामान्यीकृत डेल्टा नियम, जिसे भी कहा जाता हैback-propagation नियम, छिपी हुई परत के वांछित मूल्यों को बनाने का एक तरीका है।

गणितीय सूत्रीकरण

सक्रियण कार्य के लिए $ y_ {k} \: = \: f (y_ {इंक}) $ शुद्ध परत पर शुद्ध इनपुट के साथ ही आउटपुट परत पर व्युत्पन्न किया जा सकता है

$$ y_ {स्याही} \: = \: \ displaystyle \ योग \ limits_i \: z_ {मैं} {w_ जेके} $$

और $ \: \: y_ {घायल} \ _: = \: \ sum_i x_ {i} v_ {ij} $

अब जो त्रुटि होनी है वह कम से कम है

$$ ई \: = \: \ frac {1} {2} \ displaystyle \ योग \ limits_ {कश्मीर} \: [T_ {कश्मीर} \: - \: y_ {k}] ^ 2 $$

श्रृंखला नियम का उपयोग करके, हमारे पास है

$$ \ frac {\ आंशिक E} {\ आंशिक w_ {jk}} \: = \: \ frac {\ आंशिक} {\ आंशिक w_ {jk}} (\ frac {1} {2} \ displaystyle / sum \} limits_ {कश्मीर} \: [T_ {कश्मीर} \: - \: y_ {k}] ^ 2) $$

$ $ = \: \ frac {\ आंशिक} {\ आंशिक w_ {jk}} \ lgroup \ frac {1} {2} [t_ {k} \ _: - \: t (y_ {स्याही})] 2 \ _ rgroup $$

$$ = \: - [t_ {k} \: - \: y_ {k}] \ frac {\ आंशिक} {\ आंशिक w_ {jk}} f (y_ {स्याही}) $ $

$ $ = \: - [t_ {k} \: - \: y_ {k}] f (y_ {स्याही}) \ frac {\ आंशिक} {\ आंशिक w_ {jk}} (y_ {स्याही}) $ $

$$ = \: - [T_ {कश्मीर} \: - \: y_ {कश्मीर}] च ^ { '} (y_ {स्याही}) z_ {j} $$

अब हम कहते हैं कि $ \ delta_ {k} \: = \: - [t_ {k} \ _: - \: y_ {k}] f ^ {'} (y_ {इंक}) $

छिपी हुई इकाई के कनेक्शन पर वजन zj द्वारा दिया जा सकता है -

$$ \ frac {\ आंशिक E} {\ आंशिक v_ {ij}} \: = \: - \ displaystyle \ sum \ limit_ {k} \ delta_ {k} \ frac {\ आंशिक} {\ आंशिक v {{ij} } \ :( y_ {स्याही}) $$

$ Y_ {इंक} $ का मूल्य डालते हुए हम निम्नलिखित प्राप्त करेंगे

$$ \ delta_ {j} \: = \: - \ displaystyle \ योग \ limits_ {कश्मीर} \ delta_ {k} {w_ जेके} च ^ { '} (z_ {इंज}) $$

वेट अपडेट इस प्रकार किया जा सकता है -

आउटपुट यूनिट के लिए -

$$ \ Delta w_ {jk} \: = \: - \ Alpha \ frac {\ आंशिक ई} {{आंशिक w_ {jk}} $$

$$ = \: \ अल्फा \: \ delta_ {कश्मीर} \: z_ {j} $$

छिपी हुई इकाई के लिए -

$$ \ Delta v_ {ij} \: = \: - \ Alpha \ frac {\ आंशिक E} {\ आंशिक v_ {ij}} $ $

$$ = \: \ अल्फा \: \ delta_ {j} \: x_ {मैं} $$