पायथन एपीआई ऑटोग्रैड और इनिशियलाइज़र

यह अध्याय MXNet में ऑटोग्राद और इनिशलाइज़र API से संबंधित है।

mxnet.autograd

यह NDArray के लिए MXNet का ऑटोग्रैड API है। इसकी निम्न श्रेणी है -

कक्षा: समारोह ()

इसका उपयोग ऑटोग्राद में अनुकूलित भेदभाव के लिए किया जाता है। इसे इस प्रकार लिखा जा सकता हैmxnet.autograd.Function। यदि, किसी भी कारण से, उपयोगकर्ता डिफ़ॉल्ट श्रृंखला-नियम द्वारा गणना किए गए ग्रेडिएंट का उपयोग नहीं करना चाहता है, तो वह गणना के लिए भेदभाव को अनुकूलित करने के लिए mxnet.autograd के फ़ंक्शन वर्ग का उपयोग कर सकता है। इसके दो तरीके हैं फारवर्ड () और बैकवर्ड ()।

आइए हम निम्नलिखित बिंदुओं की सहायता से इस वर्ग के कार्य को समझते हैं -

  • सबसे पहले, हमें आगे की विधि में अपनी गणना को परिभाषित करने की आवश्यकता है।

  • फिर, हमें पिछड़े विधि में अनुकूलित भेदभाव प्रदान करने की आवश्यकता है।

  • अब क्रमिक गणना के दौरान, उपयोगकर्ता द्वारा परिभाषित पिछड़े फ़ंक्शन के बजाय, mxnet.autograd उपयोगकर्ता द्वारा परिभाषित पिछड़े फ़ंक्शन का उपयोग करेगा। हम आगे और साथ ही पिछड़े में कुछ ऑपरेशन के लिए अरपी सरणी और वापस भी डाल सकते हैं।

Example

Mxnet.autograd.function क्लास का उपयोग करने से पहले, आइए एक स्थिर सिग्मॉइड फ़ंक्शन को बैकवर्ड के साथ-साथ आगे के तरीकों के साथ परिभाषित करें -

class sigmoid(mx.autograd.Function):
   def forward(self, x):
      y = 1 / (1 + mx.nd.exp(-x))
      self.save_for_backward(y)
      return y
   
   def backward(self, dy):
      y, = self.saved_tensors
      return dy * y * (1-y)

अब, फ़ंक्शन क्लास का उपयोग निम्नानुसार किया जा सकता है -

func = sigmoid()
x = mx.nd.random.uniform(shape=(10,))
x.attach_grad()
with mx.autograd.record():
m = func(x)
m.backward()
dx_grad = x.grad.asnumpy()
dx_grad

Output

जब आप कोड चलाते हैं, तो आपको निम्न आउटपुट दिखाई देंगे -

array([0.21458015, 0.21291625, 0.23330082, 0.2361367 , 0.23086983,
0.24060014, 0.20326573, 0.21093895, 0.24968489, 0.24301809],
dtype=float32)

तरीके और उनके पैरामीटर

निम्नलिखित mxnet.autogard.function वर्ग के तरीके और उनके मानदंड हैं -

तरीके और इसके पैरामीटर परिभाषा
आगे (सिर [, head_grads, maintain_graph,…]) इस विधि का उपयोग आगे की गणना के लिए किया जाता है।
पिछड़ा (सिर [, head_grads, maintain_graph,…]) इस विधि का उपयोग पिछड़ी गणना के लिए किया जाता है। यह पहले से चिह्नित चर के संबंध में प्रमुखों के ग्रेडिएंट की गणना करता है। यह विधि आगे के आउटपुट के रूप में कई इनपुट लेती है। यह NDArray के आगे के इनपुट के रूप में भी लौटता है।
get_symbol (एक्स) इस विधि का उपयोग रिकॉर्ड किए गए गणना इतिहास को पुनः प्राप्त करने के लिए किया जाता है Symbol
ग्रेड (सिर, चर [, head_grads,…]) यह विधि चर के संबंध में प्रमुखों के ग्रेडिएंट की गणना करती है। एक बार गणना करने के बाद, चर.ग्रेड में संग्रहीत करने के बजाय, ग्रेडर को नए एनडीएआर के रूप में लौटा दिया जाएगा।
is_recording () इस पद्धति की मदद से हम रिकॉर्डिंग पर स्थिति प्राप्त कर सकते हैं और रिकॉर्डिंग नहीं कर सकते।
is_training () इस पद्धति की मदद से हम प्रशिक्षण और भविष्यवाणी पर स्थिति प्राप्त कर सकते हैं।
mark_variables (चर, ग्रेडिएंट [, grad_reqs]) यह विधि ऑटोग्राड के लिए ढाल की गणना करने के लिए चर के रूप में NDArrays को चिह्नित करेगी। यह विधि एक चर में फ़ंक्शन .attach_grad () के समान है लेकिन एकमात्र अंतर यह है कि इस कॉल के साथ हम किसी भी मूल्य के लिए ढाल सेट कर सकते हैं।
ठहराव ([train_mode]) यह विधि उन कोडों के लिए 'स्टेटमेंट' के साथ प्रयोग होने के लिए एक गुंजाइश संदर्भ देती है, जिन्हें गणना करने के लिए ग्रेडिएंट की आवश्यकता नहीं होती है।
predict_mode () यह विधि 'के साथ' कथन में उपयोग की जाने वाली एक गुंजाइश संदर्भ देती है जिसमें फॉरवर्ड पास व्यवहार को इंट्रेंस मोड में सेट किया जाता है और जो रिकॉर्डिंग स्टेट्स को बदले बिना होता है।
रिकॉर्ड ([train_mode]) यह वापस आ जाएगी autograd रिकॉर्डिंग स्कोप संदर्भ को 'स्टेटमेंट' के साथ प्रयोग किया जाता है और कोड को कैप्चर किया जाता है जिसे ग्रेडिएंट की गणना करने की आवश्यकता होती है।
set_recording (is_recording) Is_recoring () के समान, इस पद्धति की सहायता से हम रिकॉर्डिंग पर स्थिति प्राप्त कर सकते हैं और रिकॉर्डिंग नहीं कर सकते।
set_training (is_training) Is_traininig () के समान, इस पद्धति की सहायता से हम प्रशिक्षण या पूर्वानुमान की स्थिति निर्धारित कर सकते हैं।
train_mode () यह पद्धति 'स्टेटमेंट' के साथ प्रयोग किए जाने वाले एक स्कोप संदर्भ को लौटाएगी, जिसमें फॉरवर्ड पास व्यवहार को प्रशिक्षण मोड में सेट किया गया है और जो रिकॉर्डिंग स्टेट्स को बदले बिना है।

कार्यान्वयन उदाहरण

नीचे दिए गए उदाहरण में, हम चर के संबंध में सिर के ढाल की गणना करने के लिए mxnet.autograd.grad () विधि का उपयोग करेंगे -

x = mx.nd.ones((2,))
x.attach_grad()
with mx.autograd.record():
z = mx.nd.elemwise_add(mx.nd.exp(x), x)
dx_grad = mx.autograd.grad(z, [x], create_graph=True)
dx_grad

Output

उत्पादन का उल्लेख नीचे दिया गया है -

[
[3.7182817 3.7182817]
<NDArray 2 @cpu(0)>]

हम 'में' में इस्तेमाल होने की गुंजाइश वापस करने के लिए mxnet.autograd.predict_mode () विधि का उपयोग कर सकते हैं -

with mx.autograd.record():
y = model(x)
with mx.autograd.predict_mode():
y = sampling(y)
backward([y])

mxnet.intializer

यह वेट इनिशियलाइज़र के लिए एमएक्सनेट एपीआई है। इसके निम्न वर्ग हैं -

कक्षाएं और उनके पैरामीटर

निम्नलिखित तरीके और उनके पैरामीटर हैं mxnet.autogard.function वर्ग:

कक्षाएं और इसके पैरामीटर परिभाषा
द्विरेखीय () इस वर्ग की मदद से हम अप-सैंपलिंग परतों के लिए वजन को इनिशियलाइज़ कर सकते हैं।
नियत मान) यह वर्ग किसी दिए गए मान के लिए भार को प्रारंभ करता है। मान एक स्केलर के साथ-साथ NDArray हो सकता है जो सेट किए जाने वाले पैरामीटर के आकार से मेल खाता है।
FusedRNN (init, num_hidden, num_layers, mode) जैसा कि नाम से ही स्पष्ट है कि यह वर्ग फ्यूज्ड रिकरंट न्यूरल नेटवर्क (RNN) लेयर्स के लिए मापदंडों को इनिशियलाइज़ करता है।
InitDesc यह आरंभीकरण पैटर्न के लिए विवरणक के रूप में कार्य करता है।
प्रारंभकर्ता (** kwargs) यह एक इनिशलाइज़र का बेस क्लास है।
LSTMBias ([forget_bias]) यह वर्ग एक LSTMCell के सभी पूर्वाग्रहों को 0.0 से आरंभ करता है, लेकिन भूल गेट को छोड़कर जिसका पूर्वाग्रह एक कस्टम मूल्य पर सेट है।
लोड (परम [, default_init, क्रिया]] यह वर्ग फ़ाइल या शब्दकोश से डेटा लोड करके चर को आरंभ करता है।
MSRAPrelu ([factor_type, ढलान]) जैसा कि नाम से ही स्पष्ट है, यह वर्ग MSRA पेपर के अनुसार वजन को इनिशियलाइज़ करता है।
मिश्रित (पैटर्न, इनिशियलाइज़र) यह कई इनिशियलाइज़र्स का उपयोग करके पैरामीटर को इनिशियलाइज़ करता है।
सामान्य ([सिग्मा]) सामान्य () वर्ग शून्य और मानक विचलन (SD) के माध्य से सामान्य वितरण से लिए गए यादृच्छिक मानों के साथ वजन को प्रारंभिक करता है। sigma
एक() यह एक के लिए पैरामीटर के वजन को इनिशियलाइज़ करता है।
ऑर्थोगोनल ([स्केल, रैंड_टाइप]) जैसा कि नाम से ही स्पष्ट है, यह वर्ग ऑर्थोगोनल मैट्रिक्स के रूप में वजन को इनिशियलाइज़ करता है।
वर्दी ([पैमाने]) यह यादृच्छिक मानों के साथ वज़न को नियंत्रित करता है जो समान रूप से दिए गए रेंज से नमूना होता है।
जेवियर ([rnd_type, factor_type, परिमाण]) यह वास्तव में एक इनिशाइज़र लौटाता है जो वज़न के लिए "ज़ेवियर" आरंभीकरण करता है।
शून्य () यह पैरामीटर के भार को शून्य तक आरम्भ करता है।

कार्यान्वयन उदाहरण

नीचे दिए गए उदाहरण में, हम mxnet.init.Normal () वर्ग का उपयोग एक इनिशियलाइज़र का निर्माण करेंगे और इसके मापदंडों को पुनः प्राप्त करेंगे -

init = mx.init.Normal(0.8)
init.dumps()

Output

उत्पादन नीचे दिया गया है -

'["normal", {"sigma": 0.8}]'

Example

init = mx.init.Xavier(factor_type="in", magnitude=2.45)
init.dumps()

Output

उत्पादन नीचे दिखाया गया है -

'["xavier", {"rnd_type": "uniform", "factor_type": "in", "magnitude": 2.45}]'

नीचे दिए गए उदाहरण में, हम mxnet.initializer.Mixed () वर्ग का उपयोग करते हुए कई इनिशियलाइज़र्स का उपयोग करते हुए मापदंडों को शुरू करेंगे -

init = mx.initializer.Mixed(['bias', '.*'], [mx.init.Zero(),
mx.init.Uniform(0.1)])
module.init_params(init)

for dictionary in module.get_params():
for key in dictionary:
print(key)
print(dictionary[key].asnumpy())

Output

उत्पादन नीचे दिखाया गया है -

fullyconnected1_weight
[[ 0.0097627 0.01856892 0.04303787]]
fullyconnected1_bias
[ 0.]