Apache MXNet - सिस्टम घटक
यहां, Apache MXNet में सिस्टम घटकों के बारे में विस्तार से बताया गया है। सबसे पहले, हम एमएक्सनेट में निष्पादन इंजन के बारे में अध्ययन करेंगे।
निष्पादन इंजन
Apache MXNet का निष्पादन इंजन बहुत बहुमुखी है। हम इसे गहरी सीखने के साथ-साथ किसी भी डोमेन-विशिष्ट समस्या के लिए उपयोग कर सकते हैं: उनकी निर्भरता के बाद कार्यों का एक गुच्छा निष्पादित करें। इसे इस तरह से डिज़ाइन किया गया है कि निर्भरता वाले कार्यों को क्रमबद्ध किया जाता है, जबकि बिना निर्भरता वाले कार्यों को समानांतर में निष्पादित किया जा सकता है।
कोर इंटरफ़ेस
नीचे दिया गया एपीआई Apache MXNet के निष्पादन इंजन के लिए मुख्य इंटरफ़ेस है -
virtual void PushSync(Fn exec_fun, Context exec_ctx,
std::vector<VarHandle> const& const_vars,
std::vector<VarHandle> const& mutate_vars) = 0;
उपरोक्त एपीआई में निम्नलिखित हैं -
exec_fun - एमएक्सईएनटी का मुख्य इंटरफ़ेस एपीआई हमें निष्पादन संदर्भ इंजन के साथ, इसकी संदर्भ जानकारी और निर्भरता के साथ, निष्पादन_फुन नामक फ़ंक्शन को पुश करने की अनुमति देता है।
exec_ctx - संदर्भ जानकारी जिसमें उपर्युक्त फ़ंक्शन exec_fun निष्पादित किया जाना चाहिए।
const_vars - ये वे वेरिएबल्स हैं जिन्हें फंक्शन से पढ़ा जाता है।
mutate_vars - ये वे चर हैं जिन्हें संशोधित किया जाना है।
निष्पादन इंजन अपने उपयोगकर्ता को यह गारंटी देता है कि सामान्य चर को संशोधित करने वाले किन्हीं दो कार्यों का निष्पादन उनके पुश क्रम में क्रमबद्ध होता है।
समारोह
निम्नलिखित अपाचे MXNet के निष्पादन इंजन का प्रकार है -
using Fn = std::function<void(RunContext)>;
उपरोक्त कार्य में, RunContextरनटाइम जानकारी शामिल है। रनटाइम की जानकारी निष्पादन इंजन द्वारा निर्धारित की जानी चाहिए। का वाक्य विन्यासRunContext इस प्रकार है
struct RunContext {
// stream pointer which could be safely cast to
// cudaStream_t* type
void *stream;
};
नीचे निष्पादन इंजन के कार्यों के बारे में कुछ महत्वपूर्ण बिंदु दिए गए हैं -
सभी कार्यों को MXNet के निष्पादन इंजन के आंतरिक थ्रेड द्वारा निष्पादित किया जाता है।
फ़ंक्शन को निष्पादन इंजन में धकेलना अच्छा नहीं है क्योंकि इसके साथ ही फ़ंक्शन निष्पादन थ्रेड पर कब्जा कर लेगा और कुल थ्रूपुट को भी कम कर देगा।
इसके लिए एमएक्सनेट एक अन्य अतुल्यकालिक फ़ंक्शन निम्नानुसार प्रदान करता है
using Callback = std::function<void()>;
using AsyncFn = std::function<void(RunContext, Callback)>;
इसमें AsyncFn फ़ंक्शन हम अपने थ्रेड्स के भारी हिस्से को पारित कर सकते हैं, लेकिन निष्पादन इंजन फ़ंक्शन को तब तक समाप्त नहीं मानता जब तक हम कॉल नहीं करते callback समारोह।
प्रसंग
में Context, हम कार्य के संदर्भ को निर्दिष्ट कर सकते हैं। इसमें आमतौर पर निम्नलिखित शामिल हैं -
चाहे फ़ंक्शन को CPU या GPU पर चलाया जाना चाहिए।
यदि हम GPU को Context में निर्दिष्ट करते हैं, तो कौन से GPU का उपयोग करना है।
Context और RunContext में बहुत बड़ा अंतर है। प्रसंग में डिवाइस प्रकार और डिवाइस आईडी है, जबकि RunContext में वह जानकारी है जो केवल रनटाइम के दौरान तय की जा सकती है।
VarHandle
वरहांडल, जो फ़ंक्शंस की निर्भरता को निर्दिष्ट करने के लिए उपयोग किया जाता है, एक टोकन की तरह है (विशेष रूप से निष्पादन इंजन द्वारा प्रदान किया जाता है) हम फ़ंक्शन को संशोधित या उपयोग करने वाले बाहरी संसाधनों का प्रतिनिधित्व करने के लिए उपयोग कर सकते हैं।
लेकिन सवाल यह उठता है कि हमें वरैंडल का उपयोग करने की आवश्यकता क्यों है? ऐसा इसलिए है, क्योंकि अपाचे एमएक्सनेट इंजन को अन्य एमएक्सनेट मॉड्यूल से डिकॉउन्ड करने के लिए डिज़ाइन किया गया है।
वरहांडले के बारे में कुछ महत्वपूर्ण बिंदु निम्नलिखित हैं -
यह एक वैरिएबल की कम परिचालन लागत को बनाने, हटाने या कॉपी करने के लिए हल्का है।
हमें अपरिवर्तनीय चर यानी उन चर को निर्दिष्ट करने की आवश्यकता है जिनका उपयोग किया जाएगा const_vars।
हमें म्यूटेबल वैरिएबल यानी उन वेरिएबल्स को निर्दिष्ट करने की जरूरत है, जिन्हें संशोधित किया जाएगा mutate_vars।
निष्पादन इंजन द्वारा कार्यों के बीच निर्भरता को हल करने के लिए उपयोग किया जाने वाला नियम यह है कि किसी भी दो कार्यों का निष्पादन जब उनमें से कम से कम एक सामान्य चर को संशोधित करता है तो उनके पुश क्रम में क्रमबद्ध होता है।
एक नया चर बनाने के लिए, हम इसका उपयोग कर सकते हैं NewVar() एपीआई।
एक चर को हटाने के लिए, हम उपयोग कर सकते हैं PushDelete एपीआई।
आइये एक सरल उदाहरण से इसके कार्य को समझते हैं -
मान लीजिए कि अगर हमारे पास F1 और F2 जैसे दो फ़ंक्शन हैं और वे दोनों V2 के वेरिएबल को म्यूट करते हैं। उस स्थिति में, एफ 1 को एफ 1 के बाद निष्पादित करने की गारंटी दी जाती है यदि एफ 1 एफ 1 के बाद धकेल दिया जाता है। दूसरी तरफ, अगर F1 और F2 दोनों V2 का उपयोग करते हैं तो उनका वास्तविक निष्पादन क्रम यादृच्छिक हो सकता है।
धक्का और रुको
Push तथा wait निष्पादन इंजन के दो और उपयोगी एपीआई हैं।
निम्नलिखित दो महत्वपूर्ण विशेषताएं हैं Push एपीआई:
सभी पुश एपीआई अतुल्यकालिक हैं जिसका अर्थ है कि एपीआई कॉल तुरंत वापस आता है, भले ही धक्का दिया गया कार्य समाप्त हो या न हो।
पुश एपीआई थ्रेड सेफ नहीं है जिसका मतलब है कि केवल एक थ्रेड को एक बार में इंजन एपीआई कॉल करना चाहिए।
अब अगर हम Wait API के बारे में बात करते हैं, तो निम्नलिखित बिंदु इसका प्रतिनिधित्व करते हैं -
यदि कोई उपयोगकर्ता किसी विशिष्ट फ़ंक्शन के समाप्त होने की प्रतीक्षा करना चाहता है, तो उसे क्लोजर में कॉलबैक फ़ंक्शन शामिल करना चाहिए। एक बार शामिल होने के बाद, फ़ंक्शन के अंत में फ़ंक्शन को कॉल करें।
दूसरी ओर, यदि कोई उपयोगकर्ता सभी कार्यों के लिए इंतजार करना चाहता है जिसमें एक निश्चित चर खत्म करना शामिल है, तो उसे उपयोग करना चाहिए WaitForVar(var) एपीआई।
यदि कोई समाप्त करने के लिए सभी पुश किए गए कार्यों की प्रतीक्षा करना चाहता है, तो उपयोग करें WaitForAll () एपीआई।
कार्यों की निर्भरता को निर्दिष्ट करने के लिए उपयोग किया जाता है, एक टोकन की तरह है।
ऑपरेटर्स
Apache MXNet में ऑपरेटर एक ऐसा वर्ग है जिसमें वास्तविक संगणना तर्क के साथ-साथ सहायक जानकारी भी होती है और अनुकूलन करने में प्रणाली की सहायता करते हैं।
संचालक अंतरापृष्ठ
Forward कोर ऑपरेटर इंटरफ़ेस है जिसका सिंटैक्स निम्नानुसार है:
virtual void Forward(const OpContext &ctx,
const std::vector<TBlob> &in_data,
const std::vector<OpReqType> &req,
const std::vector<TBlob> &out_data,
const std::vector<TBlob> &aux_states) = 0;
की संरचना OpContextमें परिभाषित किया गया है Forward() इस प्रकार है:
struct OpContext {
int is_train;
RunContext run_ctx;
std::vector<Resource> requested;
}
OpContextऑपरेटर की स्थिति का वर्णन करता है (चाहे ट्रेन या परीक्षण चरण में), ऑपरेटर को किस उपकरण पर चलना चाहिए और अनुरोधित संसाधन भी। निष्पादन इंजन के दो और उपयोगी एपीआई।
ऊपर में से Forward मुख्य इंटरफ़ेस, हम अनुरोधित संसाधनों को निम्नानुसार समझ सकते हैं -
in_data तथा out_data इनपुट और आउटपुट टेंसर्स का प्रतिनिधित्व करते हैं।
req यह बताता है कि अभिकलन का परिणाम किस प्रकार लिखा गया है out_data।
OpReqType के रूप में परिभाषित किया जा सकता है -
enum OpReqType {
kNullOp,
kWriteTo,
kWriteInplace,
kAddTo
};
की तरह Forward ऑपरेटर, हम वैकल्पिक रूप से लागू कर सकते हैं Backward इंटरफ़ेस निम्नानुसार है -
virtual void Backward(const OpContext &ctx,
const std::vector<TBlob> &out_grad,
const std::vector<TBlob> &in_data,
const std::vector<TBlob> &out_data,
const std::vector<OpReqType> &req,
const std::vector<TBlob> &in_grad,
const std::vector<TBlob> &aux_states);
विभिन्न कार्य
Operator इंटरफ़ेस उपयोगकर्ताओं को निम्नलिखित कार्य करने की अनुमति देता है -
उपयोगकर्ता इन-प्लेस अपडेट निर्दिष्ट कर सकता है और मेमोरी आवंटन लागत को कम कर सकता है
इसे साफ करने के लिए, उपयोगकर्ता पायथन से कुछ आंतरिक तर्क छिपा सकता है।
उपयोगकर्ता दसियों और आउटपुट दहाई के बीच संबंध को परिभाषित कर सकता है।
अभिकलन करने के लिए, उपयोगकर्ता सिस्टम से अतिरिक्त अस्थायी स्थान प्राप्त कर सकता है।
संचालक संपत्ति
जैसा कि हम जानते हैं कि कन्वेंशनल न्यूरल नेटवर्क (CNN) में, एक कनविक्शन के कई कार्यान्वयन हैं। उनसे सर्वश्रेष्ठ प्रदर्शन प्राप्त करने के लिए, हम उन कई संकल्पों के बीच स्विच करना चाहते हैं।
यही कारण है कि, Apache MXNet ऑपरेटर इंटरफ़ेस को कार्यान्वयन इंटरफ़ेस से अलग करता है। यह अलगाव के रूप में किया जाता हैOperatorProperty वर्ग में निम्नलिखित शामिल हैं
InferShape - InferShape इंटरफ़ेस के नीचे दिए गए दो उद्देश्य हैं:
पहला उद्देश्य सिस्टम को प्रत्येक इनपुट और आउटपुट टेंसर के आकार को बताना है ताकि अंतरिक्ष को पहले आवंटित किया जा सके Forward तथा Backward कहते हैं।
दूसरा उद्देश्य यह सुनिश्चित करने के लिए आकार जांच करना है कि चलने से पहले कोई त्रुटि नहीं है।
सिंटैक्स नीचे दिया गया है -
virtual bool InferShape(mxnet::ShapeVector *in_shape,
mxnet::ShapeVector *out_shape,
mxnet::ShapeVector *aux_shape) const = 0;
Request Resource- क्या होगा अगर आपका सिस्टम cudnnConvolutionForward जैसे संचालन के लिए अभिकलन कार्यक्षेत्र का प्रबंधन कर सकता है? आपका सिस्टम अनुकूलन का प्रदर्शन कर सकता है जैसे कि अंतरिक्ष का पुन: उपयोग और कई और। यहाँ, MXNet आसानी से निम्नलिखित दो इंटरफेस की मदद से इसे प्राप्त करता है
virtual std::vector<ResourceRequest> ForwardResource(
const mxnet::ShapeVector &in_shape) const;
virtual std::vector<ResourceRequest> BackwardResource(
const mxnet::ShapeVector &in_shape) const;
लेकिन, क्या हो अगर ForwardResource तथा BackwardResourceगैर-खाली सरणियाँ लौटाएँ? उस स्थिति में, सिस्टम संबंधित संसाधनों के माध्यम से प्रदान करता हैctx में पैरामीटर Forward तथा Backward का इंटरफ़ेस Operator।
Backward dependency - Apache MXNet ने पिछड़ी निर्भरता से निपटने के लिए दो अलग-अलग ऑपरेटर हस्ताक्षर किए हैं -
void FullyConnectedForward(TBlob weight, TBlob in_data, TBlob out_data);
void FullyConnectedBackward(TBlob weight, TBlob in_data, TBlob out_grad, TBlob in_grad);
void PoolingForward(TBlob in_data, TBlob out_data);
void PoolingBackward(TBlob in_data, TBlob out_data, TBlob out_grad, TBlob in_grad);
यहां, दो महत्वपूर्ण बिंदुओं पर ध्यान दें -
FullConnectedForward में out_data का उपयोग FullConnectedBackward, और द्वारा नहीं किया जाता है
पूलिंगबैकवर्ड को पूलिंगफॉरवर्ड के सभी तर्कों की आवश्यकता होती है।
इसीलिए है FullyConnectedForward, को out_dataएक बार खपत किए गए टैंसर को सुरक्षित रूप से मुक्त किया जा सकता है क्योंकि पिछड़े फ़ंक्शन को इसकी आवश्यकता नहीं होगी। इस प्रणाली की मदद से कुछ टेंसरों को कचरा इकट्ठा करना संभव हो सके।
In place Option- Apache MXNet उपयोगकर्ताओं को मेमोरी आवंटन की लागत को बचाने के लिए एक और इंटरफ़ेस प्रदान करता है। इंटरफ़ेस तत्व-वार संचालन के लिए उपयुक्त है जिसमें इनपुट और आउटपुट दोनों ही टेंसरों का आकार समान है।
इन-प्लेस अपडेट को निर्दिष्ट करने के लिए सिंटैक्स निम्नलिखित है -
एक ऑपरेटर बनाने के लिए उदाहरण
OperatorProperty की मदद से हम एक ऑपरेटर बना सकते हैं। ऐसा करने के लिए, नीचे दिए गए चरणों का पालन करें -
virtual std::vector<std::pair<int, void*>> ElewiseOpProperty::ForwardInplaceOption(
const std::vector<int> &in_data,
const std::vector<void*> &out_data)
const {
return { {in_data[0], out_data[0]} };
}
virtual std::vector<std::pair<int, void*>> ElewiseOpProperty::BackwardInplaceOption(
const std::vector<int> &out_grad,
const std::vector<int> &in_data,
const std::vector<int> &out_data,
const std::vector<void*> &in_grad)
const {
return { {out_grad[0], in_grad[0]} }
}
चरण 1
Create Operator
पहले OperatorProperty में निम्नलिखित इंटरफ़ेस लागू करें:
virtual Operator* CreateOperator(Context ctx) const = 0;
उदाहरण नीचे दिया गया है -
class ConvolutionOp {
public:
void Forward( ... ) { ... }
void Backward( ... ) { ... }
};
class ConvolutionOpProperty : public OperatorProperty {
public:
Operator* CreateOperator(Context ctx) const {
return new ConvolutionOp;
}
};
चरण 2
Parameterize Operator
यदि आप एक कनवल्शन ऑपरेटर को लागू करने जा रहे हैं, तो कर्नेल का आकार, स्ट्राइड साइज़, पैडिंग साइज़ और इसी तरह जानना अनिवार्य है। क्यों, क्योंकि इन मापदंडों को किसी भी कॉल करने से पहले ऑपरेटर को पारित किया जाना चाहिएForward या backward इंटरफेस।
इसके लिए, हमें परिभाषित करने की आवश्यकता है ConvolutionParam नीचे के रूप में संरचना -
#include <dmlc/parameter.h>
struct ConvolutionParam : public dmlc::Parameter<ConvolutionParam> {
mxnet::TShape kernel, stride, pad;
uint32_t num_filter, num_group, workspace;
bool no_bias;
};
अब, हमें इसे लगाने की आवश्यकता है ConvolutionOpProperty और इसे निम्नानुसार ऑपरेटर को पास करें -
class ConvolutionOp {
public:
ConvolutionOp(ConvolutionParam p): param_(p) {}
void Forward( ... ) { ... }
void Backward( ... ) { ... }
private:
ConvolutionParam param_;
};
class ConvolutionOpProperty : public OperatorProperty {
public:
void Init(const vector<pair<string, string>& kwargs) {
// initialize param_ using kwargs
}
Operator* CreateOperator(Context ctx) const {
return new ConvolutionOp(param_);
}
private:
ConvolutionParam param_;
};
चरण 3
Register the Operator Property Class and the Parameter Class to Apache MXNet
अंत में, हमें ऑपरेटर संपत्ति वर्ग और पैरामीटर वर्ग को एमएक्सईएनटी में पंजीकृत करने की आवश्यकता है। यह निम्नलिखित मैक्रोज़ की मदद से किया जा सकता है -
DMLC_REGISTER_PARAMETER(ConvolutionParam);
MXNET_REGISTER_OP_PROPERTY(Convolution, ConvolutionOpProperty);
उपरोक्त मैक्रो में, पहला तर्क नाम स्ट्रिंग है और दूसरा गुण वर्ग नाम है।