तंत्रिका नेटवर्क प्रशिक्षण के लिए सिफारिशें
इस अध्याय में, हम तंत्रिका नेटवर्क प्रशिक्षण के विभिन्न पहलुओं को समझेंगे, जिसे TensorFlow ढांचे का उपयोग करके लागू किया जा सकता है।
निम्नलिखित दस सिफारिशें हैं, जिनका मूल्यांकन किया जा सकता है -
वापस प्रचार
आंशिक प्रसार की गणना करने के लिए बैक प्रचार एक सरल विधि है, जिसमें तंत्रिका जाल के लिए सबसे उपयुक्त रचना का मूल रूप शामिल है।
स्टोचैस्टिक ग्रेडिएंट डिसेंट
स्टोकेस्टिक क्रमिक वंश में, ए batchउदाहरणों की कुल संख्या है, जो उपयोगकर्ता एक एकल पुनरावृत्ति में ढाल की गणना करने के लिए उपयोग करता है। अब तक, यह माना जाता है कि बैच संपूर्ण डेटा सेट है। सबसे अच्छा चित्रण Google के पैमाने पर काम कर रहा है; डेटा सेट में अक्सर अरबों या सैकड़ों अरबों उदाहरण होते हैं।
सीखना दर क्षय
अधिगम दर को अपनाना ग्रेडिएंट डिसेंट ऑप्टिमाइज़ेशन की सबसे महत्वपूर्ण विशेषताओं में से एक है। यह TensorFlow कार्यान्वयन के लिए महत्वपूर्ण है।
ड्रॉप आउट
बड़ी संख्या में मापदंडों के साथ गहरे तंत्रिका जाल शक्तिशाली मशीन लर्निंग सिस्टम बनाते हैं। हालाँकि, इस तरह के नेटवर्क में ओवर फिटिंग एक गंभीर समस्या है।
मैक्स पूलिंग
मैक्स पूलिंग एक नमूना-आधारित विवेकाधीन प्रक्रिया है। ऑब्जेक्ट एक इनपुट प्रतिनिधित्व को नीचे-नमूना करने के लिए है, जो आवश्यक मान्यताओं के साथ आयामीता को कम करता है।
लंबी अवधि की मेमोरी (LSTM)
एलएसटीएम इस निर्णय को नियंत्रित करता है कि निर्दिष्ट न्यूरॉन के भीतर क्या इनपुट लिया जाना चाहिए। इसमें यह तय करने पर नियंत्रण शामिल है कि क्या गणना की जानी चाहिए और क्या आउटपुट उत्पन्न किया जाना चाहिए।