अपाचे एमएक्सनेट - पायथन एपीआई ग्लोन

जैसा कि हमने पिछले अध्यायों में पहले ही चर्चा की है कि, एमएक्सनेट ग्लोन डीएल परियोजनाओं के लिए एक स्पष्ट, संक्षिप्त और सरल एपीआई प्रदान करता है। यह एपाचे एमएक्सनेट को प्रशिक्षण गति को आगे बढ़ाए बिना डीएल मॉडल को प्रोटोटाइप, निर्माण और प्रशिक्षित करने में सक्षम बनाता है।

अंतर्भाग मापदंड

आइए हम अपाचे एमएक्सनेट पायथन एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) ग्लूऑन के मुख्य मॉड्यूलों को जानें।

gluon.nn

Gluon.nn मॉड्यूल में Gluon बड़ी संख्या में बिल्ड-एन एन परतों को प्रदान करता है। यही कारण है कि इसे कोर मॉड्यूल कहा जाता है।

तरीके और उनके पैरामीटर

निम्नलिखित कुछ महत्वपूर्ण तरीकों और उनके मापदंडों को शामिल किया गया है mxnet.gluon.nn मुख्य मॉड्यूल -

तरीके और इसके पैरामीटर परिभाषा
सक्रियण (सक्रियण, ** kwargs) जैसा कि नाम से पता चलता है, यह विधि इनपुट के लिए एक सक्रियण फ़ंक्शन लागू करती है।
ExpressPool1D ([पूल_साइज़, स्ट्राइड्स, पेडिंग,…]) यह अस्थायी डेटा के लिए औसत पूलिंग ऑपरेशन है।
ExpressPool2D ([पूल_साइज़, स्ट्राइड्स, पेडिंग,…]) यह स्थानिक डेटा के लिए औसत पूलिंग ऑपरेशन है।
ExpressPool3D ([पूल_साइज़, स्ट्राइड्स, पेडिंग,…]) यह 3 डी डेटा के लिए औसत पूलिंग ऑपरेशन है। डेटा स्थानिक या अनुपात-अस्थायी हो सकता है।
बैचनॉर्म ([अक्ष, गति, एप्सिलॉन, केंद्र,…]) यह बैच सामान्यीकरण परत का प्रतिनिधित्व करता है।
बैचमोरेल्लू ([अक्ष, गति, एप्सिलॉन,…]) यह बैच सामान्यीकरण परत का भी प्रतिनिधित्व करता है, लेकिन रिले सक्रियण फ़ंक्शन के साथ।
ब्लॉक ([उपसर्ग, परम)) यह सभी तंत्रिका नेटवर्क परतों और मॉडल के लिए आधार वर्ग देता है।
Conv1D (चैनल, kernel_size [, strides,…]) इस विधि का उपयोग 1-डी कनवल्शन लेयर के लिए किया जाता है। उदाहरण के लिए, अस्थायी आक्षेप।
Conv1DTranspose (चैनल, kernel_size [,…]) इस विधि का उपयोग ट्रांसपोज़्ड 1 डी कनवल्शन लेयर के लिए किया जाता है।
Conv2D (चैनल, kernel_size [, strides,…]) इस विधि का उपयोग 2D कनवल्शन लेयर के लिए किया जाता है। उदाहरण के लिए, छवियों पर स्थानिक दृढ़ संकल्प)।
Conv2DTranspose (चैनल, kernel_size [,…]) इस विधि का उपयोग ट्रांसपोज़्ड 2D कन्वेंशन लेयर के लिए किया जाता है।
Conv3D (चैनल, kernel_size [, strides,…]) इस विधि का उपयोग 3D कनवल्शन लेयर के लिए किया जाता है। उदाहरण के लिए, वॉल्यूम पर स्थानिक आक्षेप।
Conv3DTranspose (चैनल, kernel_size [,…]) इस विधि का उपयोग ट्रांसपोज़्ड 3 डी कनवल्शन लेयर के लिए किया जाता है।
घना (इकाइयां [, सक्रियण, उपयोग_बीयस,…]) यह विधि आपके नियमित रूप से घनी-जुड़ी एनएन परत के लिए प्रतिनिधित्व करती है।
ड्रॉपआउट (दर [, कुल्हाड़ी]) जैसा कि नाम से पता चलता है, विधि इनपुट के लिए ड्रॉपआउट लागू करती है।
ELU ([अल्फा]) इस विधि का उपयोग घातीय रैखिक इकाई (ELU) के लिए किया जाता है।
एम्बेडिंग (input_dim, output_dim [, dtype,…]) यह गैर-नकारात्मक पूर्णांक को निश्चित आकार के घने वैक्टर में बदल देता है।
समतल (** kwargs) यह विधि 2-डी के इनपुट को समतल करती है।
GELU (** kwargs) इस विधि का उपयोग गॉसियन एक्सपोनेंशियल लाइनियर यूनिट (जीईएलयू) के लिए किया जाता है।
GlobalAvgPool1D ([लेआउट]) इस पद्धति की मदद से, हम लौकिक डेटा के लिए वैश्विक औसत पूलिंग ऑपरेशन कर सकते हैं।
GlobalAvgPool2D ([लेआउट]) इस पद्धति की मदद से, हम स्थानिक डेटा के लिए वैश्विक औसत पूलिंग ऑपरेशन कर सकते हैं।
GlobalAvgPool3D ([लेआउट]) इस पद्धति की मदद से, हम 3-डी डेटा के लिए वैश्विक औसत पूलिंग ऑपरेशन कर सकते हैं।
GlobalMaxPool1D ([लेआउट]) इस पद्धति की मदद से, हम 1-डी डेटा के लिए वैश्विक अधिकतम पूलिंग ऑपरेशन कर सकते हैं।
GlobalMaxPool2D ([लेआउट]) इस पद्धति की मदद से, हम 2-डी डेटा के लिए वैश्विक अधिकतम पूलिंग ऑपरेशन कर सकते हैं।
GlobalMaxPool3D ([लेआउट]) इस पद्धति की मदद से, हम 3-डी डेटा के लिए वैश्विक अधिकतम पूलिंग ऑपरेशन कर सकते हैं।
GroupNorm ([num_groups, एप्सिलॉन, केंद्र,…]) यह विधि समूह सामान्यीकरण को nD इनपुट एरे पर लागू करती है।
हाइब्रिडब्लॉक ([उपसर्ग, परम)] यह विधि दोनों के साथ अग्रेषण का समर्थन करती है Symbol तथा NDArray
HybridLambda(फ़ंक्शन [, उपसर्ग]) इस पद्धति की सहायता से हम हाइब्रिडब्लॉक ऑब्जेक्ट के रूप में ऑपरेटर या अभिव्यक्ति को लपेट सकते हैं।
हाइब्रिड असमान ([उपसर्ग, परम)) यह हाइब्रिडब्लॉक को क्रमिक रूप से स्टैक करता है।
InstanceNorm ([अक्ष, एप्सिलॉन, केंद्र, स्केल,…)) यह विधि nD इनपुट ऐरे में उदाहरण सामान्यीकरण लागू करती है।

कार्यान्वयन के उदाहरण

नीचे दिए गए उदाहरण में, हम ब्लॉक () का उपयोग करने जा रहे हैं जो सभी तंत्रिका नेटवर्क परतों और मॉडल के लिए आधार वर्ग देता है।

from mxnet.gluon import Block, nn
class Model(Block):
   def __init__(self, **kwargs):
      super(Model, self).__init__(**kwargs)
      # use name_scope to give child Blocks appropriate names.
      with self.name_scope():
         self.dense0 = nn.Dense(20)
         self.dense1 = nn.Dense(20)
   def forward(self, x):

      x = mx.nd.relu(self.dense0(x))
      return mx.nd.relu(self.dense1(x))

model = Model()
model.initialize(ctx=mx.cpu(0))
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))

Output

आप निम्न आउटपुट देखेंगे -

[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)*gt;

नीचे दिए गए उदाहरण में, हम हाइब्रिडब्लॉक () का उपयोग करने जा रहे हैं जो प्रतीक और एनडीएआरआरई दोनों के साथ अग्रेषण का समर्थन करता है।

import mxnet as mx
from mxnet.gluon import HybridBlock, nn


class Model(HybridBlock):
   def __init__(self, **kwargs):
      super(Model, self).__init__(**kwargs)
      # use name_scope to give child Blocks appropriate names.
      with self.name_scope():
         self.dense0 = nn.Dense(20)
         self.dense1 = nn.Dense(20)

   def forward(self, x):
      x = nd.relu(self.dense0(x))
      return nd.relu(self.dense1(x))
model = Model()
model.initialize(ctx=mx.cpu(0))

model.hybridize()
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))

Output

उत्पादन का उल्लेख नीचे दिया गया है -

[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)>

gluon.rnn

ग्लोन बड़ी संख्या में बिल्ड-इन प्रदान करता है recurrent neural network(RNN) gluon.rn मॉड्यूल में परतें। यही कारण है, इसे कोर मॉड्यूल कहा जाता है।

तरीके और उनके पैरामीटर

निम्नलिखित कुछ महत्वपूर्ण तरीकों और उनके मापदंडों को शामिल किया गया है mxnet.gluon.nn मुख्य मॉड्यूल:

तरीके और इसके पैरामीटर परिभाषा
BidirectionalCell (l_cell, r_cell [,…]) इसका उपयोग बिडायरेक्शनल रिकरंट न्यूरल नेटवर्क (RNN) सेल के लिए किया जाता है।
ड्रॉपआउटसेल (दर [, अक्ष, उपसर्ग, परम]] यह विधि दिए गए इनपुट पर ड्रॉपआउट लागू करेगी।
GRU (हिडेन_साइज़ [, num_layers, Layout,…]) यह एक दिए गए इनपुट अनुक्रम में एक बहु-परत gated आवर्तक इकाई (GRU) RNN लागू करता है।
GRUCell (छिपे हुए_साइज़ [,…]) इसका उपयोग गेटेड रेक्टिफाइड यूनिट (GRU) नेटवर्क सेल के लिए किया जाता है।
HybridRecurrentCell ([उपसर्ग, परम)) यह विधि संकरण का समर्थन करती है।
HybridSequentialRNNCell ([उपसर्ग, परम)) इस पद्धति की मदद से हम कई हाइब्रिडआरएनएन कोशिकाओं को क्रमिक रूप से स्टैक कर सकते हैं।
LSTM (hidden_size [, num_layers, Layout,…]) 0 यह किसी दिए गए इनपुट अनुक्रम में एक बहु-परत लंबी अवधि की मेमोरी (LSTM) RNN लागू करता है।
LSTMCell (हिडन_साइज़ [,…]) इसका उपयोग Long-Short Term Memory (LSTM) नेटवर्क सेल के लिए किया जाता है।
ModifierCell (base_cell) यह संशोधक कोशिकाओं के लिए बेस क्लास है।
RNN (हिडेन_साइज़ [, अंक, सक्रियण,…]) यह एक बहु-परत Elman RNN के साथ लागू होता है tanh या ReLU किसी दिए गए इनपुट अनुक्रम में गैर-रैखिकता।
आरएनएनसीएल (हिडेनसाइज़ [, सक्रियण,…]) इसका उपयोग एल्मन आरएनएन आवर्तक तंत्रिका नेटवर्क सेल के लिए किया जाता है।
आवर्तक ([उपसर्ग, परम)) यह RNN कोशिकाओं के लिए सार आधार वर्ग का प्रतिनिधित्व करता है।
SequentialRNNCell ([उपसर्ग, परम)) इस पद्धति की मदद से हम कई आरएनएन कोशिकाओं को क्रमिक रूप से स्टैक कर सकते हैं।
ज़ोनआउटसेल (बेस_सेल [, ज़ोनआउट_आउटपुट्स,…]) यह विधि बेस सेल पर ज़ोनआउट लागू होती है।

कार्यान्वयन के उदाहरण

नीचे दिए गए उदाहरण में, हम GRU () का उपयोग करने जा रहे हैं जो एक बहु-परत gated आवर्तक इकाई (GRU) RNN को दिए गए इनपुट अनुक्रम पर लागू करता है।

layer = mx.gluon.rnn.GRU(100, 3)
layer.initialize()
input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq, h0)
out_seq

Output

यह निम्नलिखित उत्पादन का उत्पादन करता है -

[[[ 1.50152072e-01 5.19012511e-01 1.02390535e-01 ... 4.35803324e-01
1.30406499e-01 3.30152437e-02]
[ 2.91542172e-01 1.02243155e-01 1.73325196e-01 ... 5.65296151e-02
1.76546033e-02 1.66693389e-01]
[ 2.22257316e-01 3.76294643e-01 2.11277917e-01 ... 2.28903517e-01
3.43954474e-01 1.52770668e-01]]


[[ 1.40634328e-01 2.93247789e-01 5.50393537e-02 ... 2.30207980e-01
6.61415309e-02 2.70989928e-02]
[ 1.11081995e-01 7.20834285e-02 1.08342394e-01 ... 2.28330195e-02
6.79589901e-03 1.25501186e-01]
[ 1.15944080e-01 2.41565228e-01 1.18612610e-01 ... 1.14908054e-01
1.61080107e-01 1.15969211e-01]]
………………………….

Example

hn

Output

यह निम्नलिखित उत्पादन का उत्पादन करता है -

[[[-6.08105101e-02 3.86217088e-02   6.64453954e-03 8.18805695e-02
3.85607071e-02 -1.36945639e-02 7.45836645e-03 -5.46515081e-03
9.49622393e-02 6.39371723e-02 -6.37890724e-03 3.82240303e-02
9.11015049e-02 -2.01375950e-02 -7.29381144e-02 6.93765879e-02
2.71829776e-02 -6.64435029e-02 -8.45306814e-02 -1.03075653e-01
6.72040805e-02 -7.06537142e-02 -3.93818803e-02 5.16211614e-03
-4.79770005e-02 1.10734522e-01 1.56721435e-02 -6.93409378e-03
1.16915874e-01 -7.95962065e-02 -3.06530762e-02 8.42394680e-02
7.60370195e-02 2.17055440e-01 9.85361822e-03 1.16660878e-01
4.08297703e-02 1.24978097e-02 8.25245082e-02 2.28673983e-02
-7.88266212e-02 -8.04114193e-02 9.28791538e-02 -5.70827350e-03
-4.46166918e-02 -6.41122833e-02 1.80885363e-02 -2.37745279e-03
4.37298454e-02 1.28888980e-01 -3.07202265e-02 2.50503756e-02
4.00907174e-02 3.37077095e-03 -1.78839862e-02 8.90695080e-02
6.30150884e-02 1.11416787e-01 2.12221760e-02 -1.13236710e-01
5.39616570e-02 7.80710578e-02 -2.28817668e-02 1.92073174e-02
………………………….

नीचे दिए गए उदाहरण में हम LSTM () का उपयोग करने जा रहे हैं जो किसी दिए गए इनपुट अनुक्रम में एक दीर्घकालिक-अल्पकालिक मेमोरी (LSTM) RNN लागू करता है।

layer = mx.gluon.rnn.LSTM(100, 3)
layer.initialize()

input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
c0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq,[h0,c0])
out_seq

Output

उत्पादन का उल्लेख नीचे दिया गया है -

[[[ 9.00025964e-02 3.96071747e-02 1.83841765e-01 ... 3.95872220e-02
1.25569820e-01 2.15555862e-01]
[ 1.55962542e-01 -3.10300849e-02 1.76772922e-01 ... 1.92474753e-01
2.30574399e-01 2.81707942e-02]
[ 7.83204585e-02 6.53361529e-03 1.27262697e-01 ... 9.97719541e-02
1.28254429e-01 7.55299702e-02]]
[[ 4.41036932e-02 1.35250352e-02 9.87644792e-02 ... 5.89378644e-03
5.23949116e-02 1.00922674e-01]
[ 8.59075040e-02 -1.67027581e-02 9.69351009e-02 ... 1.17763653e-01
9.71239135e-02 2.25218050e-02]
[ 4.34580036e-02 7.62207608e-04 6.37005866e-02 ... 6.14888743e-02
5.96345589e-02 4.72368896e-02]]
……………

Example

hn

Output

जब आप कोड चलाते हैं, तो आपको निम्न आउटपुट दिखाई देंगे -

[
[[[ 2.21408084e-02 1.42750628e-02 9.53067932e-03 -1.22849066e-02
1.78788435e-02 5.99269159e-02 5.65306023e-02 6.42553642e-02
6.56616641e-03 9.80876666e-03 -1.15729487e-02 5.98640442e-02
-7.21173314e-03 -2.78371759e-02 -1.90690923e-02 2.21447181e-02
8.38765781e-03 -1.38521893e-02 -9.06938594e-03 1.21346042e-02
6.06449470e-02 -3.77471633e-02 5.65885007e-02 6.63008019e-02
-7.34188128e-03 6.46054149e-02 3.19911093e-02 4.11194898e-02
4.43960279e-02 4.92892228e-02 1.74766723e-02 3.40303481e-02
-5.23341820e-03 2.68163737e-02 -9.43402853e-03 -4.11836170e-02
1.55221792e-02 -5.05655073e-02 4.24557598e-03 -3.40388380e-02
……………………

प्रशिक्षण मॉड्यूल

ग्लोन में प्रशिक्षण मॉड्यूल निम्नानुसार हैं -

gluon.loss

में mxnet.gluon.lossमॉड्यूल, ग्लूऑन पूर्व-परिभाषित नुकसान फ़ंक्शन प्रदान करता है। मूल रूप से, इसमें तंत्रिका नेटवर्क के प्रशिक्षण के लिए नुकसान हैं। यही कारण है कि इसे प्रशिक्षण मॉड्यूल कहा जाता है।

तरीके और उनके पैरामीटर

निम्नलिखित कुछ महत्वपूर्ण तरीकों और उनके मापदंडों को शामिल किया गया है mxnet.gluon.loss प्रशिक्षण मॉड्यूल:

तरीके और इसके पैरामीटर परिभाषा
हानि (वजन, बैच_आक्सिस, ** क्वार्ग्स) यह नुकसान के लिए आधार वर्ग के रूप में कार्य करता है।
L2Loss ([वजन, बैच_एक्सिस]) यह बीच में मतलब चुकता त्रुटि (MSE) की गणना करता है label तथा prediction(pred)
L1Loss ([वजन, बैच_एक्सिस]) यह बीच की पूर्ण निरपेक्ष त्रुटि (MAE) की गणना करता है label तथा pred
SigmoidBinaryCrossEntropyLoss ([...]) इस पद्धति का उपयोग द्विआधारी वर्गीकरण के लिए क्रॉस-एन्ट्रापी नुकसान के लिए किया जाता है।
SigmoidBCELoss इस पद्धति का उपयोग द्विआधारी वर्गीकरण के लिए क्रॉस-एन्ट्रापी नुकसान के लिए किया जाता है।
SoftmaxCrossEntropyLoss ([अक्ष,…]) यह सॉफ्टमैक्स क्रॉस-एंट्रोपी लॉस (CEL) की गणना करता है।
SoftmaxCELoss यह सॉफ्टमैक्स क्रॉस एन्ट्रापी लॉस की गणना भी करता है।
KLDivLoss ([from_logits, अक्ष, वजन,…]) इसका उपयोग कुलबबैक-लीब्लर डाइवरेज लॉस के लिए किया जाता है।
CTCLoss ([लेआउट, लेबल_ वेलआउट, वजन]) यह कनेक्शन टेम्पोरल क्लासिफिकेशन लॉस (TCL) के लिए उपयोग किया जाता है।
ह्यूबरलॉस ([आरएच, वजन, बैच_आक्सिस]) यह चिकनी एल 1 नुकसान की गणना करता है। सुचारू L1 नुकसान L1 नुकसान के बराबर होगा यदि पूर्ण त्रुटि rho से अधिक हो, लेकिन L2 हानि के बराबर है।
हिंजलॉस ([मार्जिन, वजन, बैच_आक्सिस]) यह विधि अक्सर SVM में उपयोग किए जाने वाले काज हानि फ़ंक्शन की गणना करती है:
स्क्वरहाइडलंग्लॉस ([मार्जिन, वजन, बैच_आक्सिस]) यह विधि SVMs में उपयोग किए जाने वाले सॉफ्ट-मार्जिन लॉस फ़ंक्शन की गणना करती है:
लॉजिस्टिकलॉस ([वजन, बैच_एक्सिस, लेबल_फॉर्मेट]) यह विधि लॉजिस्टिक लॉस की गणना करती है।
ट्रिपलटॉस ([मार्जिन, वजन, बैच_एक्सिस]) यह विधि तीन इनपुट टेंसर्स और एक सकारात्मक मार्जिन दिए गए ट्रिपल लॉस की गणना करती है।
PoissonNLLLoss ([वजन, from_logits,…]) फ़ंक्शन नेगेटिव लॉग संभावना हानि की गणना करता है।
CosineEmbeddingLoss ([वजन, बैच_एक्सिस, मार्जिन]) फ़ंक्शन वैक्टर के बीच कोसाइन दूरी की गणना करता है।
SDMLLoss ([smoothing_parameter, वजन,…]) यह विधि बैचवाइज स्मूथड डीप मेट्रिक लर्निंग (एसडीएमएल) लॉस की गणना करती है जो दो इनपुट टेंसर और एक स्मूद वेट एसडीएम लॉस देती है। यह संभावित नकारात्मक उदाहरणों के रूप में मिनीबैच में अनपेक्षित नमूनों का उपयोग करके युग्मित नमूनों के बीच समानता सीखता है।

उदाहरण

जैसा कि हम जानते हैं कि mxnet.gluon.loss.lossलेबल और भविष्यवाणी (पूर्व) के बीच MSE (मीन चुकता त्रुटि) की गणना करेगा। यह निम्नलिखित सूत्र की सहायता से किया जाता है:

gluon.parameter

mxnet.gluon.parameter एक कंटेनर है जो मापदंडों को रखता है यानी ब्लॉक का वजन।

तरीके और उनके पैरामीटर

निम्नलिखित कुछ महत्वपूर्ण तरीकों और उनके मापदंडों को शामिल किया गया है mxnet.gluon.parameter प्रशिक्षण मॉड्यूल -

तरीके और इसके पैरामीटर परिभाषा
डाली (dtype) यह विधि इस पैरामीटर के डेटा और ग्रेडिएंट को एक नए डेटा प्रकार में डालेगी।
डेटा ([ctx]) यह विधि एक संदर्भ पर इस पैरामीटर की एक प्रति लौटाएगी।
स्नातक ([ctx]) यह विधि इस पैरामीटर के लिए एक संदर्भ में एक ढाल बफर लौटाएगी।
आरंभ करें ([init, ctx, default_init,…]) यह विधि पैरामीटर और ग्रेडिएंट सरणियों को इनिशियलाइज़ करेगी।
list_ctx () यह विधि उन संदर्भों की सूची लौटाएगी जिन पर यह पैरामीटर आरंभिक है।
list_data () यह विधि सभी संदर्भों पर इस पैरामीटर की प्रतियां लौटाएगी। यह निर्माण के रूप में उसी क्रम में किया जाएगा।
list_grad () यह पद्धति सभी संदर्भों में ढाल बफ़र्स लौटाएगी। यह उसी क्रम में किया जाएगा जैसे किvalues()
list_row_sparse_data (row_id) यह विधि सभी संदर्भों पर 'row_sparse' पैरामीटर की प्रतियां लौटाएगी। यह सृजन के समान क्रम में किया जाएगा।
reset_ctx (ctx) यह विधि पैरामीटर को अन्य संदर्भों में फिर से असाइन करेगी।
row_sparse_data (row_id) यह विधि 'row_sparse' पैरामीटर की एक प्रति को row_id के संदर्भ में वापस लौटाएगी।
set_data (डेटा) यह विधि सभी संदर्भों पर इस पैरामीटर्स का मान निर्धारित करेगी।
वर () यह विधि इस पैरामीटर का प्रतिनिधित्व करने वाला एक प्रतीक लौटाएगी।
zero_grad () यह विधि सभी संदर्भों पर ग्रेडिएंट बफर को 0 पर सेट करेगी।

कार्यान्वयन उदाहरण

नीचे दिए गए उदाहरण में, हम मापदंडों और ग्रेडिएंट सरणियों को इनिशियलाइज़ () विधि के रूप में निम्नानुसार आरंभीकृत करेंगे।

weight = mx.gluon.Parameter('weight', shape=(2, 2))
weight.initialize(ctx=mx.cpu(0))
weight.data()

Output

उत्पादन का उल्लेख नीचे दिया गया है -

[[-0.0256899 0.06511251]
[-0.00243821 -0.00123186]]
<NDArray 2x2 @cpu(0)>

Example

weight.grad()

Output

उत्पादन नीचे दिया गया है -

[[0. 0.]
[0. 0.]]
<NDArray 2x2 @cpu(0)>

Example

weight.initialize(ctx=[mx.gpu(0), mx.gpu(1)])
weight.data(mx.gpu(0))

Output

आप निम्न आउटपुट देखेंगे -

[[-0.00873779 -0.02834515]
 [ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(0)>

Example

weight.data(mx.gpu(1))

Output

जब आप उपरोक्त कोड निष्पादित करते हैं, तो आपको निम्नलिखित आउटपुट देखना चाहिए -

[[-0.00873779 -0.02834515]
 [ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(1)>

gluon.trainer

mxnet.gluon.trainer मापदंडों के एक सेट पर एक अनुकूलक लागू करता है। इसका उपयोग ऑटोग्राद के साथ मिलकर किया जाना चाहिए।

तरीके और उनके पैरामीटर

निम्नलिखित कुछ महत्वपूर्ण तरीकों और उनके मापदंडों को शामिल किया गया है mxnet.gluon.trainer प्रशिक्षण मॉड्यूल -

तरीके और इसके पैरामीटर परिभाषा
allreduce_grads () यह विधि प्रत्येक पैरामीटर (वजन) के लिए अलग-अलग संदर्भों से ग्रेडिएंट्स को कम करेगी।
load_states (fname) जैसा कि नाम से ही स्पष्ट है, यह विधि ट्रेनर राज्यों को लोड करेगी।
save_states (fname) जैसा कि नाम से ही स्पष्ट है, यह विधि प्रशिक्षक राज्यों को बचाएगा।
set_learning_rate (एलआर) यह विधि ऑप्टिमाइज़र की एक नई सीखने की दर निर्धारित करेगी।
चरण (बैच_साइज़ [, ign_stale_grad]) यह विधि पैरामीटर अद्यतन का एक चरण बनाएगी। इसके बाद बुलाया जाना चाहिएautograd.backward() और के बाहर record() गुंजाइश।
अद्यतन (batch_size [, ign_stale_grad]) यह विधि पैरामीटर अद्यतन का एक चरण भी बनाएगी। इसके बाद बुलाया जाना चाहिएautograd.backward() और के बाहर record() गुंजाइश और ट्रेनर के बाद।

डेटा मॉड्यूल

Gluon के डेटा मॉड्यूल नीचे दिए गए हैं -

gluon.data

Gluon.data मॉड्यूल में ग्लूऑन बड़ी संख्या में बिल्ड-इन डेटासेट उपयोगिताओं को प्रदान करता है। यही कारण है कि इसे डेटा मॉड्यूल कहा जाता है।

कक्षाएं और उनके पैरामीटर

निम्नलिखित कुछ महत्वपूर्ण तरीके और उनके पैरामीटर mxnet.gluon.data कोर मॉड्यूल द्वारा कवर किए गए हैं। ये विधियाँ आम तौर पर डेटासेट, सैंपलिंग और डेटालेडर से संबंधित हैं।

डेटासेट
तरीके और इसके पैरामीटर परिभाषा
ArrayDataset (* args) यह विधि एक डेटासेट का प्रतिनिधित्व करती है जो दो या दो से अधिक डेटासेट जैसी वस्तुओं को जोड़ती है। उदाहरण के लिए, डेटासेट, सूचियाँ, सरणियाँ, आदि।
बैचस्म्लर (नमूना, बैच_साइज [, last_batch]) यह विधि दूसरे के ऊपर लपेटती है Sampler। एक बार लपेटने के बाद यह नमूनों के मिनी बैचों को लौटाता है।
DataLoader (डेटासेट [, batch_size, फेरबदल,…]) बैचस्म्लर के समान लेकिन यह विधि डेटासेट से डेटा लोड करती है। एक बार लोड होने पर यह डेटा के मिनी बैचों को लौटा देता है।
यह अमूर्त डेटासेट वर्ग का प्रतिनिधित्व करता है।
FilterSampler (fn, डाटासेट) यह विधि एक डेटासेट से नमूने तत्वों का प्रतिनिधित्व करती है जिसके लिए fn (फ़ंक्शन) रिटर्न करता है True
RandomSampler (लम्बाई) यह विधि बेतरतीब ढंग से प्रतिस्थापन के बिना [0, लंबाई) से नमूने तत्वों का प्रतिनिधित्व करती है।
RecordFileDataset (फ़ाइल का नाम) यह एक डेटा रिकार्डर फाइल पर रैपिंग का प्रतिनिधित्व करता है। फ़ाइल का विस्तार है.rec
नमूना यह सैंपलर्स के लिए बेस क्लास है।
अनुक्रमिक नमूना (लंबाई [, प्रारंभ]) यह सेट से नमूना तत्वों का प्रतिनिधित्व करता है [प्रारंभ, प्रारंभ + लंबाई) क्रमिक रूप से।
यह सेट से नमूना तत्वों का प्रतिनिधित्व करता है [प्रारंभ, प्रारंभ + लंबाई) क्रमिक रूप से। यह विशेष रूप से सूचियों और सरणियों के लिए सरल डेटासेट रैपर का प्रतिनिधित्व करता है।

कार्यान्वयन के उदाहरण

नीचे दिए गए उदाहरण में, हम उपयोग करने जा रहे हैं gluon.data.BatchSampler()एपीआई, जो दूसरे नमूने पर लपेटता है। यह नमूनों के मिनी बैचों को लौटाता है।

import mxnet as mx
from mxnet.gluon import data
sampler = mx.gluon.data.SequentialSampler(15)
batch_sampler = mx.gluon.data.BatchSampler(sampler, 4, 'keep')
list(batch_sampler)

Output

उत्पादन का उल्लेख नीचे दिया गया है -

[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14]]

gluon.data.vision.datasets

ग्लूऑन बड़ी संख्या में पूर्व-निर्धारित दृष्टि डेटासेट फ़ंक्शन प्रदान करता है gluon.data.vision.datasets मापांक।

कक्षाएं और उनके पैरामीटर

एमएक्सनेट हमें उपयोगी और महत्वपूर्ण डेटासेट प्रदान करता है, जिनके वर्ग और पैरामीटर नीचे दिए गए हैं -

कक्षाएं और इसके पैरामीटर परिभाषा
MNIST ([रूट, ट्रेन, परिवर्तन]) यह एक उपयोगी डेटासेट है जो हमें हस्तलिखित अंक प्रदान करता है। MNIST डेटासेट के लिए url http://yann.lecun.com/exdb/mnist है
FashionMNIST ([रूट, ट्रेन, परिवर्तन]) इस डेटासेट में ज़ालैंडो के लेख के चित्र हैं, जिनमें फैशन उत्पाद शामिल हैं। यह मूल MNIST डेटासेट का प्रतिस्थापन है। आप इस डेटासेट को https://github.com/zalandoresearch/fashion-mnist से प्राप्त कर सकते हैं
CIFAR10 ([रूट, ट्रेन, परिवर्तन]) यह https://www.cs.toronto.edu/~kriz/cifar.html से एक छवि वर्गीकरण डेटासेट है। इस डेटासेट में प्रत्येक नमूना आकृति (32, 32, 3) के साथ एक छवि है।
CIFAR100 ([रूट, ललित_लबेल, ट्रेन, परिवर्तन]) यह https://www.cs.toronto.edu/~kriz/cifar.html से CIFAR100 छवि वर्गीकरण डेटासेट है। इसमें प्रत्येक नमूना आकृति के साथ एक छवि है (32, 32, 3)।
ImageRecordDataset (फ़ाइल नाम [, ध्वज, परिवर्तन]) यह डेटासेट एक रिकॉर्डियो फ़ाइल पर लपेट रहा है जिसमें चित्र हैं। इसमें प्रत्येक नमूना अपने संबंधित लेबल के साथ एक छवि है।
ImageFolderDataset (रूट [, ध्वज, परिवर्तन]) यह छवि फ़ाइलों को लोड करने के लिए एक डेटासेट है जो एक फ़ोल्डर संरचना में संग्रहीत है।
ImageListDataset ([रूट, इमली सूची, झंडा]) यह छवि फ़ाइलों को लोड करने के लिए एक डेटासेट है जो प्रविष्टियों की सूची द्वारा निर्दिष्ट किया गया है।

उदाहरण

नीचे दिए गए उदाहरण में, हम ImageListDataset () का उपयोग दिखाने जा रहे हैं, जिसका उपयोग प्रविष्टियों की सूची द्वारा निर्दिष्ट छवि फ़ाइलों को लोड करने के लिए किया जाता है -

# written to text file *.lst

0 0 root/cat/0001.jpg
1 0 root/cat/xxxa.jpg
2 0 root/cat/yyyb.jpg
3 1 root/dog/123.jpg
4 1 root/dog/023.jpg
5 1 root/dog/wwww.jpg

# A pure list, each item is a list [imagelabel: float or list of float, imgpath]

[[0, root/cat/0001.jpg]
[0, root/cat/xxxa.jpg]
[0, root/cat/yyyb.jpg]
[1, root/dog/123.jpg]
[1, root/dog/023.jpg]
[1, root/dog/wwww.jpg]]

उपयोगिता मॉड्यूल

ग्लोन में उपयोगिता मॉड्यूल निम्नानुसार हैं -

gluon.utils

Gluon.utils मॉड्यूल में ग्लूऑन बड़ी संख्या में बिल्ट-इन समानांतराइजेशन यूटिलिटी ऑप्टिमाइज़र प्रदान करता है। यह प्रशिक्षण के लिए विभिन्न प्रकार की उपयोगिताओं प्रदान करता है। यही कारण है कि इसे यूटिलिटी मॉड्यूल कहा जाता है।

कार्य और उनके पैरामीटर

इस उपयोगिता मॉड्यूल में शामिल कार्यों और उनके पैरामीटर निम्नलिखित हैं gluon.utils −

कार्य और इसके पैरामीटर परिभाषा
स्प्लिट_डेटा (डेटा, num_slice [, batch_axis,…]) यह फ़ंक्शन आमतौर पर डेटा समानता के लिए उपयोग किया जाता है और प्रत्येक स्लाइस को एक डिवाइस यानी GPU पर भेजा जाता है। यह एक NDArray को विभाजित करता हैnum_slice साथ में स्लाइस batch_axis
स्प्लिट_अंड_लोड (डेटा, ctx_list [, batch_axis,…]) यह फ़ंक्शन NDArray में विभाजित होता है len(ctx_list) साथ में स्लाइस batch_axis. स्प्लिट_डाटा () फ़ंक्शन के ऊपर से एकमात्र अंतर यह है कि, यह प्रत्येक स्लाइस को एक संदर्भ में लोड करता है ctx_list
clip_global_norm (सरणियाँ, max_norm [,…]) इस समारोह का काम NDArrays को इस तरह से पुनर्विक्रय करना है कि उनके 2-मान का योग इससे छोटा है max_norm
check_sha1 (फ़ाइल नाम, sha1_hash) यह फ़ंक्शन यह जाँच करेगा कि फ़ाइल सामग्री का sha1 हैश अपेक्षित हैश से मेल खाता है या नहीं।
डाउनलोड (url [, पाथ, ओवरराइट, sha1_hash,…]) जैसा कि नाम निर्दिष्ट करता है, यह फ़ंक्शन दिए गए URL को डाउनलोड करेगा।
प्रतिस्थापित_फाइल (src, dst) यह समारोह परमाणु को लागू करेगा os.replace। यह लिनक्स और OSX के साथ किया जाएगा।