अपाचे एमएक्सनेट - ग्लोन
एक और सबसे महत्वपूर्ण एमएक्सनेट पायथन पैकेज ग्लोन है। इस अध्याय में, हम इस पैकेज पर चर्चा करेंगे। डीएल परियोजनाओं के लिए ग्लूऑन एक स्पष्ट, संक्षिप्त और सरल एपीआई प्रदान करता है। यह एपाचे एमएक्सनेट को प्रशिक्षण गति को आगे बढ़ाए बिना डीएल मॉडल को प्रोटोटाइप, निर्माण और प्रशिक्षित करने में सक्षम बनाता है।
ब्लाकों
ब्लॉक अधिक जटिल नेटवर्क डिज़ाइन का आधार बनाते हैं। एक तंत्रिका नेटवर्क में, जैसे तंत्रिका नेटवर्क की जटिलता बढ़ जाती है, हमें एकल से न्यूरॉन्स की पूरी परतों को डिजाइन करने से स्थानांतरित करने की आवश्यकता है। उदाहरण के लिए, रेसनेट -152 जैसे एनएन डिज़ाइन में नियमितता की एक बहुत ही उचित डिग्री हैblocks परतों के दोहराया जाना।
उदाहरण
नीचे दिए गए उदाहरण में, हम कोड को एक साधारण ब्लॉक, अर्थात् एक बहुपरत अवधारणात्मक के लिए ब्लॉक लिखेंगे।
from mxnet import nd
from mxnet.gluon import nn
x = nd.random.uniform(shape=(2, 20))
N_net = nn.Sequential()
N_net.add(nn.Dense(256, activation='relu'))
N_net.add(nn.Dense(10))
N_net.initialize()
N_net(x)
Output
यह निम्न आउटपुट का उत्पादन करता है:
[[ 0.09543004 0.04614332 -0.00286655 -0.07790346 -0.05130241 0.02942038
0.08696645 -0.0190793 -0.04122177 0.05088576]
[ 0.0769287 0.03099706 0.00856576 -0.044672 -0.06926838 0.09132431
0.06786592 -0.06187843 -0.03436674 0.04234696]]
<NDArray 2x10 @cpu(0)>
एक या एक से अधिक परतों के ब्लॉक को परिभाषित करने के लिए परतों को परिभाषित करने के लिए आवश्यक कदम -
Step 1 - ब्लॉक डेटा को इनपुट के रूप में लें।
Step 2- अब, ब्लॉक राज्य को मापदंडों के रूप में संग्रहीत करेंगे। उदाहरण के लिए, उपरोक्त कोडिंग उदाहरण में ब्लॉक में दो छिपी हुई परतें हैं और हमें इसके लिए मापदंडों को संग्रहीत करने के लिए जगह की आवश्यकता है।
Step 3- अगला ब्लॉक आगे के प्रसार को करने के लिए आगे के कार्य को आमंत्रित करेगा। इसे आगे की संगणना भी कहा जाता है। पहले फॉरवर्ड कॉल के एक भाग के रूप में, एक आलसी फैशन में पैरामीटर को इनिशियलाइज़ करता है।
Step 4- अंत में ब्लॉक पिछड़े कार्य को आमंत्रित करेंगे और उनके इनपुट के संदर्भ में ढाल की गणना करेंगे। आमतौर पर, यह चरण स्वचालित रूप से किया जाता है।
अनुक्रमिक ब्लॉक
एक अनुक्रमिक ब्लॉक एक विशेष प्रकार का ब्लॉक है जिसमें डेटा ब्लॉक के एक अनुक्रम से बहता है। इसमें, प्रत्येक ब्लॉक को इनपुट डेटा पर पहले ब्लॉक को लागू करने से पहले एक के आउटपुट पर लागू किया गया था।
आइये देखते हैं कैसे sequential वर्ग के काम -
from mxnet import nd
from mxnet.gluon import nn
class MySequential(nn.Block):
def __init__(self, **kwargs):
super(MySequential, self).__init__(**kwargs)
def add(self, block):
self._children[block.name] = block
def forward(self, x):
for block in self._children.values():
x = block(x)
return x
x = nd.random.uniform(shape=(2, 20))
N_net = MySequential()
N_net.add(nn.Dense(256, activation
='relu'))
N_net.add(nn.Dense(10))
N_net.initialize()
N_net(x)
Output
उत्पादन के साथ दी गई है -
[[ 0.09543004 0.04614332 -0.00286655 -0.07790346 -0.05130241 0.02942038
0.08696645 -0.0190793 -0.04122177 0.05088576]
[ 0.0769287 0.03099706 0.00856576 -0.044672 -0.06926838 0.09132431
0.06786592 -0.06187843 -0.03436674 0.04234696]]
<NDArray 2x10 @cpu(0)>
कस्टम ब्लॉक
हम आसानी से ऊपर बताए गए अनुक्रमिक ब्लॉक के साथ संघनन से परे जा सकते हैं। लेकिन, अगर हम अनुकूलन करना चाहते हैं तो दBlockवर्ग हमें आवश्यक कार्यक्षमता भी प्रदान करता है। ब्लॉक क्लास में nn मॉड्यूल में एक मॉडल कंस्ट्रक्टर दिया गया है। हम उस मॉडल निर्माता को विरासत में दे सकते हैं जो हम चाहते हैं कि मॉडल को परिभाषित करें।
निम्नलिखित उदाहरण में, ए MLP class ओवरराइड करता है __init__ और ब्लॉक वर्ग के आगे के कार्य।
आइए देखें कि यह कैसे काम करता है।
class MLP(nn.Block):
def __init__(self, **kwargs):
super(MLP, self).__init__(**kwargs)
self.hidden = nn.Dense(256, activation='relu') # Hidden layer
self.output = nn.Dense(10) # Output layer
def forward(self, x):
hidden_out = self.hidden(x)
return self.output(hidden_out)
x = nd.random.uniform(shape=(2, 20))
N_net = MLP()
N_net.initialize()
N_net(x)
Output
जब आप कोड चलाते हैं, तो आपको निम्न आउटपुट दिखाई देगा:
[[ 0.07787763 0.00216403 0.01682201 0.03059879 -0.00702019 0.01668715
0.04822846 0.0039432 -0.09300035 -0.04494302]
[ 0.08891078 -0.00625484 -0.01619131 0.0380718 -0.01451489 0.02006172
0.0303478 0.02463485 -0.07605448 -0.04389168]]
<NDArray 2x10 @cpu(0)>
कस्टम परतें
अपाचे एमएक्सनेट की ग्लोन एपीआई एक पूर्व-परिभाषित परतों की एक मामूली संख्या के साथ आती है। लेकिन फिर भी कुछ बिंदु पर, हम पा सकते हैं कि एक नई परत की आवश्यकता है। हम ग्लोन एपीआई में आसानी से एक नई परत जोड़ सकते हैं। इस खंड में, हम देखेंगे कि हम स्क्रैच से एक नई परत कैसे बना सकते हैं।
सरलतम कस्टम परत
ग्लोन एपीआई में एक नई परत बनाने के लिए, हमें ब्लॉक वर्ग से विरासत में मिली एक कक्षा बनाना होगा जो सबसे बुनियादी कार्यक्षमता प्रदान करती है। हम पूर्व से परिभाषित सभी परतों को सीधे या अन्य उपवर्गों के माध्यम से विरासत में प्राप्त कर सकते हैं।
नई परत बनाने के लिए, लागू करने के लिए आवश्यक एकमात्र उदाहरण विधि है forward (self, x)। यह विधि परिभाषित करती है, कि हमारी परत आगे के प्रसार के दौरान क्या करने जा रही है। जैसा कि पहले भी चर्चा की गई है, ब्लॉक के लिए बैक-प्रचार पास स्वचालित रूप से अपाचे एमएक्सनेट द्वारा किया जाएगा।
उदाहरण
नीचे दिए गए उदाहरण में, हम एक नई परत को परिभाषित करेंगे। हम भी लागू करेंगेforward() इनपुट डेटा को सामान्य करने की विधि [0, 1] की सीमा में फिट करके।
from __future__ import print_function
import mxnet as mx
from mxnet import nd, gluon, autograd
from mxnet.gluon.nn import Dense
mx.random.seed(1)
class NormalizationLayer(gluon.Block):
def __init__(self):
super(NormalizationLayer, self).__init__()
def forward(self, x):
return (x - nd.min(x)) / (nd.max(x) - nd.min(x))
x = nd.random.uniform(shape=(2, 20))
N_net = NormalizationLayer()
N_net.initialize()
N_net(x)
Output
उपरोक्त कार्यक्रम निष्पादित करने पर, आपको निम्नलिखित परिणाम मिलेगा -
[[0.5216355 0.03835821 0.02284337 0.5945146 0.17334817 0.69329053
0.7782702 1. 0.5508242 0. 0.07058554 0.3677264
0.4366546 0.44362497 0.7192635 0.37616986 0.6728799 0.7032008
0.46907538 0.63514024]
[0.9157533 0.7667402 0.08980197 0.03593295 0.16176797 0.27679572
0.07331014 0.3905285 0.6513384 0.02713427 0.05523694 0.12147208
0.45582628 0.8139887 0.91629887 0.36665893 0.07873632 0.78268915
0.63404864 0.46638715]]
<NDArray 2x20 @cpu(0)>
संकरण
इसे अपाचे एमएक्सनेट द्वारा इस्तेमाल की जाने वाली एक प्रक्रिया के रूप में परिभाषित किया जा सकता है, जो आगे की गणना का एक प्रतीकात्मक ग्राफ बनाता है। हाइब्रिडिज़ेशन एमएक्सनेट को कम्प्यूटेशनल प्रतीकात्मक ग्राफ को अनुकूलित करके गणना प्रदर्शन को बढ़ाने की अनुमति देता है। बल्कि सीधे विरासत में मिली हैBlockवास्तव में, हम पा सकते हैं कि मौजूदा परतों को लागू करते समय एक ब्लॉक एक से विरासत में मिला HybridBlock।
इसके कारण निम्नलिखित हैं -
Allows us to write custom layers: हाइब्रिडब्लॉक हमें उन कस्टम परतों को लिखने की अनुमति देता है जो आगे अनिवार्य और प्रतीकात्मक प्रोग्रामिंग दोनों में उपयोग की जा सकती हैं।
Increase computation performance- हाइब्रिडब्लॉक कम्प्यूटेशनल प्रतीकात्मक ग्राफ को अनुकूलित करता है जो एमएक्सनेट को कम्प्यूटेशन प्रदर्शन को बढ़ाने की अनुमति देता है।
उदाहरण
इस उदाहरण में, हम HybridBlock का उपयोग करके, ऊपर बनाई गई हमारी उदाहरण परत को फिर से लिखेंगे:
class NormalizationHybridLayer(gluon.HybridBlock):
def __init__(self):
super(NormalizationHybridLayer, self).__init__()
def hybrid_forward(self, F, x):
return F.broadcast_div(F.broadcast_sub(x, F.min(x)), (F.broadcast_sub(F.max(x), F.min(x))))
layer_hybd = NormalizationHybridLayer()
layer_hybd(nd.array([1, 2, 3, 4, 5, 6], ctx=mx.cpu()))
Output
उत्पादन नीचे बताया गया है:
[0. 0.2 0.4 0.6 0.8 1. ]
<NDArray 6 @cpu(0)>
हाइब्रिडाइजेशन का GPU पर कम्प्यूटेशन से कोई लेना-देना नहीं है और कोई भी CPU और GPU दोनों पर हाइब्रिड और गैर-हाइब्रिड नेटवर्क को प्रशिक्षित कर सकता है।
ब्लॉक और हाइब्रिडब्लॉक के बीच अंतर
अगर हम तुलना करेंगे Block कक्षा और HybridBlock, हम देखेंगे कि HybridBlock पहले से ही है forward() विधि लागू की गई। HybridBlock एक परिभाषित करता है hybrid_forward()वह विधि जो परतों को बनाते समय कार्यान्वित की जानी चाहिए। एफ तर्क मुख्य अंतर बनाता हैforward() तथा hybrid_forward()। एमएक्सनेट समुदाय में, एफ तर्क को बैकएंड के रूप में संदर्भित किया जाता है। F या तो संदर्भित कर सकता हैmxnet.ndarray API (अनिवार्य प्रोग्रामिंग के लिए उपयोग किया जाता है) या mxnet.symbol API (प्रतीकात्मक प्रोग्रामिंग के लिए उपयोग किया जाता है)।
नेटवर्क में कस्टम लेयर कैसे जोड़ें?
कस्टम परतों को अलग-अलग उपयोग करने के बजाय, इन परतों का उपयोग पूर्वनिर्धारित परतों के साथ किया जाता है। हम या तो उपयोग कर सकते हैंSequential या HybridSequentialएक अनुक्रमिक तंत्रिका नेटवर्क से कंटेनर। जैसा कि पहले भी चर्चा में था,Sequential कंटेनर ब्लॉक और से विरासत में मिला HybridSequential से विरासत में HybridBlock क्रमशः।
उदाहरण
नीचे दिए गए उदाहरण में, हम एक कस्टम परत के साथ एक सरल तंत्रिका नेटवर्क का निर्माण करेंगे। से आउटपुटDense (5) लेयर का इनपुट होगा NormalizationHybridLayer। का उत्पादनNormalizationHybridLayer का इनपुट बन जाएगा Dense (1) परत।
net = gluon.nn.HybridSequential()
with net.name_scope():
net.add(Dense(5))
net.add(NormalizationHybridLayer())
net.add(Dense(1))
net.initialize(mx.init.Xavier(magnitude=2.24))
net.hybridize()
input = nd.random_uniform(low=-10, high=10, shape=(10, 2))
net(input)
Output
आप निम्न आउटपुट देखेंगे -
[[-1.1272651]
[-1.2299833]
[-1.0662932]
[-1.1805027]
[-1.3382034]
[-1.2081106]
[-1.1263978]
[-1.2524893]
[-1.1044774]
[-1.316593 ]]
<NDArray 10x1 @cpu(0)>
कस्टम परत पैरामीटर
तंत्रिका नेटवर्क में, एक परत में इसके साथ जुड़े मापदंडों का एक सेट होता है। हम कभी-कभी उन्हें वजन के रूप में संदर्भित करते हैं, जो एक परत की आंतरिक स्थिति है। ये पैरामीटर विभिन्न भूमिकाएँ निभाते हैं -
कभी-कभी ये वे होते हैं जो हम बैकप्रॉपैजेशन चरण के दौरान सीखना चाहते हैं।
कभी-कभी ये केवल स्थिरांक होते हैं जिन्हें हम आगे पास के दौरान उपयोग करना चाहते हैं
यदि हम प्रोग्रामिंग अवधारणा के बारे में बात करते हैं, तो एक ब्लॉक के इन मापदंडों (भार) को संग्रहीत और एक्सेस किया जाता है ParameterDict वर्ग जो उन्हें आरंभ करने, अद्यतन करने, सहेजने और उन्हें लोड करने में मदद करता है।
उदाहरण
नीचे दिए गए उदाहरण में, हम मापदंडों के दो निम्नलिखित सेटों को परिभाषित करेंगे -
Parameter weights- यह ट्रेन करने योग्य है, और इसका आकार निर्माण चरण के दौरान अज्ञात है। यह आगे प्रसार के पहले रन पर अनुमान लगाया जाएगा।
Parameter scale- यह एक स्थिरांक है जिसका मूल्य नहीं बदलता है। पैरामीटर भार के विपरीत, इसका आकार निर्माण के दौरान परिभाषित किया गया है।
class NormalizationHybridLayer(gluon.HybridBlock):
def __init__(self, hidden_units, scales):
super(NormalizationHybridLayer, self).__init__()
with self.name_scope():
self.weights = self.params.get('weights',
shape=(hidden_units, 0),
allow_deferred_init=True)
self.scales = self.params.get('scales',
shape=scales.shape,
init=mx.init.Constant(scales.asnumpy()),
differentiable=False)
def hybrid_forward(self, F, x, weights, scales):
normalized_data = F.broadcast_div(F.broadcast_sub(x, F.min(x)),
(F.broadcast_sub(F.max(x), F.min(x))))
weighted_data = F.FullyConnected(normalized_data, weights, num_hidden=self.weights.shape[0], no_bias=True)
scaled_data = F.broadcast_mul(scales, weighted_data)
return scaled_data