कृत्रिम तंत्रिका प्रसार
कृत्रिम तंत्रिका नेटवर्क, या संक्षेप में सिर्फ तंत्रिका नेटवर्क, एक नया विचार नहीं है। यह लगभग 80 वर्षों से है।
यह 2011 तक नहीं था, जब डीप न्यूरल नेटवर्क्स नई तकनीकों, विशाल डेटासेट उपलब्धता और शक्तिशाली कंप्यूटरों के उपयोग से लोकप्रिय हो गया था।
एक तंत्रिका नेटवर्क एक न्यूरॉन की नकल करता है, जिसमें डेंड्राइट्स, एक नाभिक, अक्षतंतु और टर्मिनल अक्षतंतु होते हैं।
एक नेटवर्क के लिए, हमें दो न्यूरॉन्स की आवश्यकता होती है। ये न्यूरॉन्स एक के डेंड्राइट्स और दूसरे के टर्मिनल एक्सॉन के बीच सिनैप्स के जरिए जानकारी ट्रांसफर करते हैं।
एक कृत्रिम न्यूरॉन का एक संभावित मॉडल इस तरह दिखता है -
एक तंत्रिका नेटवर्क जैसा नीचे दिखाया गया है -
वृत्त न्यूरॉन्स या नोड होते हैं, डेटा पर उनके कार्यों के साथ और उन्हें जोड़ने वाली रेखाएं / किनारे वजन / सूचना के साथ पारित किए जा रहे हैं।
प्रत्येक स्तंभ एक परत है। आपके डेटा की पहली परत इनपुट परत है। फिर, इनपुट परत और आउटपुट परत के बीच की सभी परतें छिपी हुई परतें हैं।
यदि आपके पास एक या कुछ छिपी हुई परतें हैं, तो आपके पास एक उथले तंत्रिका नेटवर्क है। यदि आपके पास कई छिपी हुई परतें हैं, तो आपके पास एक गहरा तंत्रिका नेटवर्क है।
इस मॉडल में, आपके पास इनपुट डेटा है, आप इसे वजन करते हैं, और इसे न्यूरॉन में फ़ंक्शन के माध्यम से पास करते हैं जिसे थ्रेशोल्ड फ़ंक्शन या सक्रियण फ़ंक्शन कहा जाता है।
मूल रूप से, यह एक निश्चित मूल्य के साथ तुलना करने के बाद सभी मानों का योग है। यदि आप एक सिग्नल को फायर करते हैं, तो परिणाम (1) आउट होता है, या कुछ भी बाहर नहीं निकाल दिया जाता है, फिर (0)। फिर उसे अगले न्यूरॉन के साथ भारित और पारित किया जाता है, और उसी प्रकार का कार्य चलाया जाता है।
सक्रियण फ़ंक्शन के रूप में हमारे पास सिग्मॉइड (एस-आकार) फ़ंक्शन हो सकता है।
भार के रूप में, वे शुरू करने के लिए बस यादृच्छिक हैं, और वे नोड / न्यूरॉन में प्रति इनपुट अद्वितीय हैं।
एक सामान्य "फीड फ़ॉरवर्ड" में, सबसे बुनियादी प्रकार का न्यूरल नेटवर्क, आपके पास आपके द्वारा बनाए गए नेटवर्क के माध्यम से आपकी जानकारी सीधे पास होती है, और आप आउटपुट की तुलना उस चीज़ से करते हैं जिसकी आपको उम्मीद थी कि आउटपुट आपके नमूना डेटा का उपयोग कर रहा होगा।
यहां से, आपको अपने वांछित आउटपुट से मेल खाने के लिए अपना आउटपुट प्राप्त करने में मदद करने के लिए वज़न समायोजित करने की आवश्यकता है।
तंत्रिका नेटवर्क के माध्यम से सीधे डेटा भेजने के कार्य को कहा जाता है feed forward neural network.
हमारा डेटा इनपुट से लेयर्स तक, क्रम में, फिर आउटपुट पर जाता है।
जब हम पीछे की ओर जाते हैं और नुकसान / लागत को कम करने के लिए वजन को समायोजित करना शुरू करते हैं, तो इसे कहा जाता है back propagation.
यह एक optimization problem. तंत्रिका नेटवर्क के साथ, वास्तविक व्यवहार में, हमें सैकड़ों हजारों चर, या लाखों, या अधिक से निपटना होगा।
पहला उपाय था स्टोचैस्टिक ग्रेडिएंट डिसेंट को ऑप्टिमाइज़ेशन मेथड के रूप में इस्तेमाल करना। अब, वहाँ AdaGrad, एडम अनुकूलक और इतने पर जैसे विकल्प हैं। किसी भी तरह से, यह एक बड़े पैमाने पर कम्प्यूटेशनल ऑपरेशन है। यही कारण है कि न्यूरल नेटवर्क्स को ज्यादातर आधी सदी के लिए शेल्फ पर छोड़ दिया गया था। यह केवल हाल ही में था कि हमारे पास हमारी मशीनों में शक्ति और वास्तुकला भी थी, यहां तक कि इन ऑपरेशनों पर विचार करने के लिए, और मैच करने के लिए उचित आकार के डेटासेट भी।
सरल वर्गीकरण कार्यों के लिए, तंत्रिका नेटवर्क K के निकटतम पड़ोसियों जैसे अन्य सरल एल्गोरिदम के प्रदर्शन में अपेक्षाकृत करीब है। तंत्रिका नेटवर्क की वास्तविक उपयोगिता का एहसास तब होता है जब हमारे पास बहुत बड़ा डेटा होता है, और बहुत अधिक जटिल प्रश्न होते हैं, जो दोनों अन्य मशीन लर्निंग मॉडल को बेहतर बनाते हैं।