पर्यवेक्षित अध्ययन
जैसा कि नाम सुझाव देता है, supervised learningएक शिक्षक की देखरेख में होता है। यह सीखने की प्रक्रिया निर्भर है। पर्यवेक्षित शिक्षण के तहत एएनएन के प्रशिक्षण के दौरान, इनपुट वेक्टर नेटवर्क को प्रस्तुत किया जाता है, जो एक आउटपुट वेक्टर का उत्पादन करेगा। इस आउटपुट वेक्टर की तुलना वांछित / लक्ष्य आउटपुट वेक्टर से की जाती है। यदि वास्तविक आउटपुट और वांछित / लक्ष्य आउटपुट वेक्टर के बीच अंतर है, तो एक त्रुटि संकेत उत्पन्न होता है। इस त्रुटि संकेत के आधार पर, वजन तब तक समायोजित किया जाएगा जब तक कि वास्तविक आउटपुट वांछित आउटपुट के साथ मेल नहीं खाता।
perceptron
फ्रेंक रोसेनब्लट द्वारा मैककुलोच और पिट्स मॉडल का उपयोग करके विकसित किया गया है, परसेप्ट्रॉन कृत्रिम तंत्रिका नेटवर्क की बुनियादी परिचालन इकाई है। यह पर्यवेक्षित शिक्षण नियम को नियोजित करता है और डेटा को दो वर्गों में वर्गीकृत करने में सक्षम है।
परसेप्ट्रॉन की परिचालन विशेषताएं: इसमें एक एकल न्यूरॉन होता है, जिसमें समायोज्य वजन के साथ-साथ इनपुट की एक मनमानी संख्या होती है, लेकिन थ्रेशोल्ड के आधार पर न्यूरॉन का उत्पादन 1 या 0 होता है। इसमें एक पूर्वाग्रह भी होता है जिसका वजन हमेशा 1 होता है। निम्नलिखित आकृति परसेप्ट्रान का एक योजनाबद्ध प्रतिनिधित्व देती है।
इस प्रकार परसेप्ट्रोन में निम्नलिखित तीन मूल तत्व होते हैं -
Links - इसमें कनेक्शन लिंक का एक सेट होगा, जिसमें एक पूर्वाग्रह सहित वजन होता है जिसमें हमेशा वजन 1 होता है।
Adder - यह इनपुट को उनके संबंधित भार से गुणा करने के बाद जोड़ता है।
Activation function- यह न्यूरॉन के उत्पादन को सीमित करता है। सबसे बुनियादी सक्रियण फ़ंक्शन एक हैविसाइड चरण फ़ंक्शन है जिसमें दो संभावित आउटपुट हैं। यह फ़ंक्शन 1 रिटर्न देता है, यदि इनपुट सकारात्मक है, और किसी भी नकारात्मक इनपुट के लिए 0 है।
प्रशिक्षण एल्गोरिथ्म
Perceptron नेटवर्क को एकल आउटपुट इकाई के साथ-साथ कई आउटपुट इकाइयों के लिए प्रशिक्षित किया जा सकता है।
एकल आउटपुट यूनिट के लिए प्रशिक्षण एल्गोरिथम
Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -
- Weights
- Bias
- लर्निंग दर $ \ अल्फा $
आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।
Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।
Step 3 - हर प्रशिक्षण वेक्टर के लिए चरण 4-6 जारी रखें x।
Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -
$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$
Step 5 - अब निम्नलिखित संबंध के साथ शुद्ध इनपुट प्राप्त करें -
$ $ y_ {in} \: = \: b \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i}। \: w_ {i} $।
यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।
Step 6 - अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें।
$$ f (y_ {in}) \: = \: \ start {case} 1 और if \: y_ {in} \ _: \ _ \ _ theta \\ 0 और if \: - \ theta \: \ leqslive \ _ : y_ {in} \: \ leqslant \: \ theta \\ - 1 & if \: y_ {in} \: <\: - \ theta \ end {मामले} $ $
Step 7 - वजन और पूर्वाग्रह को निम्नानुसार समायोजित करें -
Case 1 - अगर y ≠ t फिर,
$$ w_ {मैं} (नया) \: = \: w_ {मैं} (पुराने) \: + \: \ अल्फा \: tx_ {मैं} $$
$ $ b (नया) \: = \: बी (पुराना) \: + \: \ अल्फा टी $ $
Case 2 - अगर y = t फिर,
$$ w_ {मैं} (नया) \: = \: w_ {मैं} (पुराने) $$
$$ ख (नया) \: = \: ख (पुराने) $$
यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।
Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होता है जब वजन में कोई बदलाव नहीं होता है।
एकाधिक आउटपुट इकाइयों के लिए प्रशिक्षण एल्गोरिथ्म
निम्नलिखित आरेख कई आउटपुट कक्षाओं के लिए अवधारणात्मक की वास्तुकला है।
Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -
- Weights
- Bias
- लर्निंग दर $ \ अल्फा $
आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।
Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।
Step 3 - हर प्रशिक्षण वेक्टर के लिए चरण 4-6 जारी रखें x।
Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -
$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$
Step 5 - निम्नलिखित संबंध के साथ शुद्ध इनपुट प्राप्त करें -
$$ y_ {in} \: = \: b \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i} \: w_ {ij} $$
यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।
Step 6 - प्रत्येक आउटपुट यूनिट के लिए अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें j = 1 to m -
$$ f (y_ {in}) \: = \: \ start {मामलों} 1 & if \: y_ {घायल} \ _: \ _ \ _ थीटा \\ 0 और अगर \: - \ थीटा \: \ leqslive \ " : y_ {घायल} \: \ leqslant \: \ theta \\ - 1 और if \: y_ {घायल} \: <\: - \ theta \ end {मामले} $ $
Step 7 - के लिए वजन और पूर्वाग्रह समायोजित करें x = 1 to n तथा j = 1 to m निम्नानुसार है -
Case 1 - अगर yj ≠ tj फिर,
$$ w_ {ij} (नया) \: = \: w_ {ij} (पुराने) \: + \: \ अल्फा \: T_ {j} x_ {मैं} $$
$ $ b_ {j} (नया) \: = \: b_ {j} (पुराना) \: + \: \ अल्फा t_ {j} $ $
Case 2 - अगर yj = tj फिर,
$$ w_ {ij} (नया) \: = \: w_ {ij} (पुराने) $$
$$ b_ {j} (नया) \: = \: b_ {j} (पुराने) $$
यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।
Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होगा जब वजन में कोई बदलाव नहीं होगा।
अनुकूली रैखिक न्यूरॉन (एडलिन)
Adaline जो Adaptive Linear Neuron के लिए खड़ा है, एक एकल रैखिक इकाई वाला एक नेटवर्क है। यह 1960 में विडो और हॉफ द्वारा विकसित किया गया था। एडालिन के बारे में कुछ महत्वपूर्ण बिंदु इस प्रकार हैं -
यह द्विध्रुवी सक्रियण फ़ंक्शन का उपयोग करता है।
यह प्रशिक्षण के लिए वास्तविक उत्पादन और वांछित / लक्ष्य आउटपुट के बीच मीन-चुकता त्रुटि (MSE) को कम करने के लिए डेल्टा नियम का उपयोग करता है।
वजन और पूर्वाग्रह समायोज्य हैं।
आर्किटेक्चर
Adaline की मूल संरचना अवधारणात्मक के समान है, जिसकी सहायता से एक अतिरिक्त फीडबैक लूप मिलता है जिसकी मदद से वांछित / लक्ष्य आउटपुट के साथ वास्तविक आउटपुट की तुलना की जाती है। प्रशिक्षण एल्गोरिथ्म के आधार पर तुलना के बाद, वज़न और पूर्वाग्रह को अपडेट किया जाएगा।
प्रशिक्षण एल्गोरिथ्म
Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -
- Weights
- Bias
- लर्निंग दर $ \ अल्फा $
आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।
Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।
Step 3 - हर द्विध्रुवी प्रशिक्षण जोड़ी के लिए चरण 4-6 जारी रखें s:t।
Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -
$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$
Step 5 - निम्नलिखित संबंध के साथ शुद्ध इनपुट प्राप्त करें -
$$ y_ {in} \: = \: b \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i} \: w_ {i} $ $
यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।
Step 6 - अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें -
$$ f (y_ {in}) \: = \: \ start {case} 1 & if \: y_ {in} \: \ geqslant \: 0 \\ - 1 और if \: y_ {in} \ <> \ _ 0 \ end {मामले} $ $
Step 7 - वजन और पूर्वाग्रह को निम्नानुसार समायोजित करें -
Case 1 - अगर y ≠ t फिर,
$ $ w_ {i} (नया) \: = \: w_ {i} (पुराना) \: + \: \ अल्फा (t \: - \: y_ {in}) x_ {i} $ $
$ $ b (नया) \: = \: बी (पुराना) \: + \: \ अल्फा (टी \: - \: y_ {in}) $ $
Case 2 - अगर y = t फिर,
$$ w_ {मैं} (नया) \: = \: w_ {मैं} (पुराने) $$
$$ ख (नया) \: = \: ख (पुराने) $$
यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।
$ (t \: - \; y_ {in}) $ गणना की गई त्रुटि है।
Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होगा जब वजन में कोई बदलाव नहीं होता है या प्रशिक्षण के दौरान सबसे अधिक वजन में परिवर्तन निर्दिष्ट सहिष्णुता से छोटा होता है।
मल्टीपल अडैप्टिव लीनियर न्यूरॉन (मैडलीन)
मैडालीन जो कि कई एडेप्टिव लीनियर न्यूरॉन के लिए खड़ा है, एक नेटवर्क है जिसमें समानांतर में कई एडलीन होते हैं। इसकी एकल आउटपुट इकाई होगी। मैडलीन के बारे में कुछ महत्वपूर्ण बिंदु इस प्रकार हैं -
यह एक बहुपरत अवधारणात्मक की तरह है, जहां एडलिन इनपुट और मैडलिन परत के बीच एक छिपी इकाई के रूप में कार्य करेगा।
इनपुट और एडलीन परतों के बीच वजन और पूर्वाग्रह, जैसा कि हम एडलिन वास्तुकला में देखते हैं, समायोज्य हैं।
Adaline और Madaline परतों का वजन और पूर्वाग्रह 1 है।
डेल्टा नियम की सहायता से प्रशिक्षण प्राप्त किया जा सकता है।
आर्किटेक्चर
मैडलिन की वास्तुकला में शामिल हैं “n” इनपुट परत के न्यूरॉन्स, “m”Adaline लेयर के न्यूरॉन्स, और Madaline लेयर के 1 न्यूरॉन। Adaline लेयर को हिडन लेयर माना जा सकता है क्योंकि यह इनपुट लेयर और आउटपुट लेयर यानी Madaline लेयर के बीच होती है।
प्रशिक्षण एल्गोरिथ्म
अब तक हम जानते हैं कि इनपुट और एडलीन परत के बीच केवल वज़न और पूर्वाग्रह को समायोजित किया जाना है, और एडालीन और मैडलाइन परत के बीच के वज़न और पूर्वाग्रह तय हैं।
Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -
- Weights
- Bias
- लर्निंग दर $ \ अल्फा $
आसान गणना और सरलता के लिए, वज़न और पूर्वाग्रह को 0 के बराबर सेट किया जाना चाहिए और सीखने की दर 1 के बराबर सेट की जानी चाहिए।
Step 2 - स्टॉप 3-8 जारी रखें जब रोक की स्थिति सच नहीं है।
Step 3 - हर द्विध्रुवी प्रशिक्षण जोड़ी के लिए चरण 4-6 जारी रखें s:t।
Step 4 - प्रत्येक इनपुट इकाई को निम्नानुसार सक्रिय करें -
$$ x_ {मैं} \: = \: s_ {मैं} \ :( मैं \: = \: 1 \: करने के लिए \: एन) $$
Step 5 - प्रत्येक छिपी हुई परत पर शुद्ध इनपुट प्राप्त करें, अर्थात निम्नलिखित संबंध के साथ एडलिन परत -
$$ Q_ {घायल} \ _: = \ _ b_ {j} \: + \: \ displaystyle \ sum \ limit_ {i} ^ n x_ {i} \: w_ {ij} \: \: \: j \ _ = \: 1 \: करने के लिए \: मीटर $$
यहाँ ‘b’ पूर्वाग्रह और है ‘n’ इनपुट न्यूरॉन्स की कुल संख्या है।
Step 6 - Adaline और Madaline लेयर में अंतिम आउटपुट प्राप्त करने के लिए निम्नलिखित सक्रियण फ़ंक्शन लागू करें -
$ $ f (x) \: = \: \ शुरू {केस} 1 & if \: x \: \ geqslant \: 0 \\ - 1 और if \: x \: <\: 0 \ end {केस} $। $
छिपी हुई (एडालिन) इकाई में आउटपुट
$$ Q_ {j} \: = \: च (Q_ {इंज}) $$
नेटवर्क का अंतिम आउटपुट
$$ y \: = \: च ({} में y_) $$
i.e. $ \: \: y_ {घायल} \ _: = \: b_ {0} \: + \: \ sum_ {j = 1} ^ m \: Q_ {j} \: v_ {j} $
Step 7 - त्रुटि की गणना करें और निम्नानुसार वज़न समायोजित करें -
Case 1 - अगर y ≠ t तथा t = 1 फिर,
$ $ w_ {ij} (नया) \: = \: w_ {ij} (पुराना) \: + \: \ अल्फा (1 \: - \: Q_ {घायल}) x_ {i} $ $
$ $ b_ {j} (नया) \: = \: b_ {j} (पुराना) \: + \: \ अल्फा (1 \: - \: Q_ {घायल}) $ $
इस मामले में, वज़न को अपडेट किया जाएगा Qj जहां शुद्ध इनपुट 0 के करीब है क्योंकि t = 1।
Case 2 - अगर y ≠ t तथा t = -1 फिर,
$ $ w_ {ik} (नया) \: = \: w_ {ik} (पुराना) \: + \: \ अल्फा (-1 \: - \: Q_ {स्याही}) x_ {i} $ $
$ $ b_ {k} (नया) \: = \: b_ {k} (पुराना) \: + \: \ अल्फा (-1 \: - \: Q_ {स्याही}) $ $
इस मामले में, वज़न को अपडेट किया जाएगा Qk जहां शुद्ध इनपुट सकारात्मक है क्योंकि t = -1।
यहाँ ‘y’ वास्तविक उत्पादन है और ‘t’ वांछित / लक्ष्य आउटपुट है।
Case 3 - अगर y = t फिर
वज़न में कोई बदलाव नहीं होगा।
Step 8 - रोकने की स्थिति के लिए परीक्षण, जो तब होगा जब वजन में कोई बदलाव नहीं होता है या प्रशिक्षण के दौरान सबसे अधिक वजन में परिवर्तन निर्दिष्ट सहिष्णुता से छोटा होता है।
वापस प्रसार तंत्रिका नेटवर्क
Back Propagation Neural (BPN) एक बहुपरत तंत्रिका नेटवर्क है जिसमें इनपुट परत होती है, कम से कम एक छिपी हुई परत और आउटपुट परत। जैसा कि इसके नाम से पता चलता है, इस नेटवर्क में बैक प्रोपेगेटिंग होगा। त्रुटि जो आउटपुट लेयर पर आंकी जाती है, लक्ष्य आउटपुट और वास्तविक आउटपुट की तुलना करके, इनपुट लेयर की ओर वापस प्रचारित होगी।
आर्किटेक्चर
जैसा कि चित्र में दिखाया गया है, BPN की वास्तुकला में तीन परस्पर परतें हैं, जिन पर भार होता है। छिपी हुई परत के साथ-साथ आउटपुट परत में भी पूर्वाग्रह होता है, जिसका वजन उन पर हमेशा 1 होता है। जैसा कि आरेख से स्पष्ट है, BPN का कार्य दो चरणों में होता है। एक चरण इनपुट लेयर से आउटपुट लेयर तक सिग्नल भेजता है, और दूसरा चरण आउटपुट लेयर से इनपुट लेयर तक त्रुटि को फैलाता है।
प्रशिक्षण एल्गोरिथ्म
प्रशिक्षण के लिए, बीपीएन बाइनरी सिग्मॉइड सक्रियण फ़ंक्शन का उपयोग करेगा। बीपीएन के प्रशिक्षण में निम्नलिखित तीन चरण होंगे।
Phase 1 - फीड फॉरवर्ड फेज
Phase 2 - त्रुटि का वापस प्रसार
Phase 3 - वजन का अद्यतन
इन सभी चरणों का समापन एल्गोरिथ्म में किया जाएगा
Step 1 - प्रशिक्षण शुरू करने के लिए निम्नलिखित बातों का प्रारंभ करें -
- Weights
- लर्निंग दर $ \ अल्फा $
आसान गणना और सरलता के लिए, कुछ छोटे यादृच्छिक मान लें।
Step 2 - स्टेप 3-11 तब जारी रखें जब रोक की स्थिति सही न हो।
Step 3 - हर प्रशिक्षण जोड़ी के लिए चरण 4-10 जारी रखें।
चरण 1
Step 4 - प्रत्येक इनपुट यूनिट को इनपुट सिग्नल मिलता है xi और इसे सभी के लिए छिपी इकाई को भेजता है i = 1 to n
Step 5 - निम्नलिखित संबंध का उपयोग करके छिपी इकाई में शुद्ध इनपुट की गणना करें -
$$ Q_ {घायल} \ _: = \ _ b_ {0j} \: + \: \ sum_ {i = 1} ^ n x_ {i} v_ {ij} \: \: \: \: j \: = \ _ : 1 \: करने के लिए \: p $$
यहाँ b0j छिपा इकाई पर पूर्वाग्रह है, vij पर वजन है j छिपी हुई परत की इकाई i इनपुट परत की इकाई।
अब निम्नलिखित सक्रियण फ़ंक्शन को लागू करके शुद्ध आउटपुट की गणना करें
$$ Q_ {j} \: = \: च (Q_ {इंज}) $$
छिपी परत इकाइयों के इन आउटपुट संकेतों को आउटपुट परत इकाइयों में भेजें।
Step 6 - निम्नलिखित संबंध का उपयोग करके आउटपुट परत इकाई में शुद्ध इनपुट की गणना करें -
$ $ y_ {स्याही} \: = \: b_ {0k} \: + \: \ sum_ {j = 1} ^ p \: Q_ {j} \: w_ {jk} \: \: k \: = \ _ : 1 \: करने के लिए \: मीटर $$
यहाँ b0k उत्पादन इकाई पर पूर्वाग्रह, wjk पर वजन है k से आने वाली आउटपुट लेयर की इकाई j छिपी हुई परत की इकाई।
निम्नलिखित सक्रियण फ़ंक्शन को लागू करके शुद्ध आउटपुट की गणना करें
$$ y_ {कश्मीर} \: = \: च (y_ {स्याही}) $$
2 चरण
Step 7 - प्रत्येक आउटपुट इकाई पर प्राप्त लक्ष्य पैटर्न के साथ पत्राचार में, त्रुटि सुधारक शब्द की गणना निम्नानुसार करें -
$$ \ delta_ {कश्मीर} \: = \ :( T_ {कश्मीर} \: - \: y_ {कश्मीर}) च ^ { '} (y_ {स्याही}) $$
इस आधार पर, वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करें -
$$ \ Delta v_ {jk} \: = \: \ Alpha \ delta_ {k} \: Q_ {i}} $ $
$$ \ Delta b_ {0k} \: = \: \ alp \ delta_ {k} $ $
फिर, छिपी हुई परत पर $ \ delta_ {k} $ वापस भेजें।
Step 8 - अब प्रत्येक छिपी इकाई आउटपुट इकाइयों से अपने डेल्टा इनपुट का योग होगी।
$$ \ delta_ {घायल} \ _: = \: \ displaystyle \ sum \ limit_ {k = 1} ^ m \ delta_ {k} \: w_ {jk} $$
त्रुटि शब्द की गणना निम्नानुसार की जा सकती है -
$$ \ delta_ {j} \: = \: \ delta_ {इंज} च ^ { '} (Q_ {इंज}) $$
इस आधार पर, वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करें -
$$ \ Delta w_ {ij} \: = \: \ alp \ delta_ {j} x_ {i} $ $
$$ \ Delta b_ {0j} \: = \: \ alp \ delta_ {j} $ $
चरण 3
Step 9 - प्रत्येक आउटपुट यूनिट (ykk = 1 to m) वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करता है -
$ $ v_ {jk} (नया) \: = \: v_ {jk} (पुराना) \: + \: \ Delta v_ {jk} $ $
$ $ b_ {0k} (नया) \: = \: b_ {0k} (पुराना) \: + \: \ Delta b_ {0k} $ $
Step 10 - प्रत्येक आउटपुट यूनिट (zjj = 1 to p) वजन और पूर्वाग्रह को निम्नानुसार अद्यतन करता है -
$ $ w_ {ij} (नया) \: = \: w_ {ij} (पुराना) \: + \: \ Delta w_ {ij} $ $
$ $ b_ {0j} (नया) \: = \: b_ {0j} (पुराना) \: + \: \ Delta b_ {0j} $ $
Step 11 - रोकने की स्थिति के लिए जाँच करें, जो या तो पहुंच की संख्या तक पहुंच सकता है या लक्ष्य आउटपुट वास्तविक आउटपुट से मेल खाता है।
सामान्यीकृत डेल्टा लर्निंग नियम
डेल्टा नियम केवल आउटपुट लेयर के लिए काम करता है। दूसरी ओर, सामान्यीकृत डेल्टा नियम, जिसे भी कहा जाता हैback-propagation नियम, छिपी हुई परत के वांछित मूल्यों को बनाने का एक तरीका है।
गणितीय सूत्रीकरण
सक्रियण कार्य के लिए $ y_ {k} \: = \: f (y_ {इंक}) $ शुद्ध परत पर शुद्ध इनपुट के साथ ही आउटपुट परत पर व्युत्पन्न किया जा सकता है
$$ y_ {स्याही} \: = \: \ displaystyle \ योग \ limits_i \: z_ {मैं} {w_ जेके} $$
और $ \: \: y_ {घायल} \ _: = \: \ sum_i x_ {i} v_ {ij} $
अब जो त्रुटि होनी है वह कम से कम है
$$ ई \: = \: \ frac {1} {2} \ displaystyle \ योग \ limits_ {कश्मीर} \: [T_ {कश्मीर} \: - \: y_ {k}] ^ 2 $$
श्रृंखला नियम का उपयोग करके, हमारे पास है
$$ \ frac {\ आंशिक E} {\ आंशिक w_ {jk}} \: = \: \ frac {\ आंशिक} {\ आंशिक w_ {jk}} (\ frac {1} {2} \ displaystyle / sum \} limits_ {कश्मीर} \: [T_ {कश्मीर} \: - \: y_ {k}] ^ 2) $$
$ $ = \: \ frac {\ आंशिक} {\ आंशिक w_ {jk}} \ lgroup \ frac {1} {2} [t_ {k} \ _: - \: t (y_ {स्याही})] 2 \ _ rgroup $$
$$ = \: - [t_ {k} \: - \: y_ {k}] \ frac {\ आंशिक} {\ आंशिक w_ {jk}} f (y_ {स्याही}) $ $
$ $ = \: - [t_ {k} \: - \: y_ {k}] f (y_ {स्याही}) \ frac {\ आंशिक} {\ आंशिक w_ {jk}} (y_ {स्याही}) $ $
$$ = \: - [T_ {कश्मीर} \: - \: y_ {कश्मीर}] च ^ { '} (y_ {स्याही}) z_ {j} $$
अब हम कहते हैं कि $ \ delta_ {k} \: = \: - [t_ {k} \ _: - \: y_ {k}] f ^ {'} (y_ {इंक}) $
छिपी हुई इकाई के कनेक्शन पर वजन zj द्वारा दिया जा सकता है -
$$ \ frac {\ आंशिक E} {\ आंशिक v_ {ij}} \: = \: - \ displaystyle \ sum \ limit_ {k} \ delta_ {k} \ frac {\ आंशिक} {\ आंशिक v {{ij} } \ :( y_ {स्याही}) $$
$ Y_ {इंक} $ का मूल्य डालते हुए हम निम्नलिखित प्राप्त करेंगे
$$ \ delta_ {j} \: = \: - \ displaystyle \ योग \ limits_ {कश्मीर} \ delta_ {k} {w_ जेके} च ^ { '} (z_ {इंज}) $$
वेट अपडेट इस प्रकार किया जा सकता है -
आउटपुट यूनिट के लिए -
$$ \ Delta w_ {jk} \: = \: - \ Alpha \ frac {\ आंशिक ई} {{आंशिक w_ {jk}} $$
$$ = \: \ अल्फा \: \ delta_ {कश्मीर} \: z_ {j} $$
छिपी हुई इकाई के लिए -
$$ \ Delta v_ {ij} \: = \: - \ Alpha \ frac {\ आंशिक E} {\ आंशिक v_ {ij}} $ $
$$ = \: \ अल्फा \: \ delta_ {j} \: x_ {मैं} $$