अपाचे एमएक्सनेट - एकीकृत ऑपरेटर एपीआई

यह अध्याय Apache MXNet में एकीकृत ऑपरेटर एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) के बारे में जानकारी प्रदान करता है।

SimpleOp

सिंपलओपी एक नया एकीकृत ऑपरेटर एपीआई है जो विभिन्न इनवोकिंग प्रक्रियाओं को एकीकृत करता है। एक बार आह्वान करने के बाद, यह ऑपरेटरों के मूल तत्वों की ओर लौटता है। एकीकृत ऑपरेटर को विशेष रूप से यूनीरी के साथ-साथ बाइनरी संचालन के लिए डिज़ाइन किया गया है। ऐसा इसलिए है क्योंकि अधिकांश गणितीय ऑपरेटर एक या दो ऑपरेंड में भाग लेते हैं और अधिक ऑपरेंड अनुकूलन बनाते हैं, निर्भरता से संबंधित, उपयोगी होते हैं।

हम एक उदाहरण की मदद से काम करने वाले इसके SimpleOp यूनिफाइड ऑपरेटर को समझेंगे। इस उदाहरण में, हम एक ऑपरेटर के रूप में कार्य करेंगेsmooth l1 loss, जो एल 1 और एल 2 नुकसान का मिश्रण है। हम नीचे दिए गए नुकसान को परिभाषित और लिख सकते हैं -

loss = outside_weight .* f(inside_weight .* (data - label))
grad = outside_weight .* inside_weight .* f'(inside_weight .* (data - label))

यहाँ, उपरोक्त उदाहरण में,

  • । * तत्व-वार गुणन के लिए खड़ा है

  • f, f’ सुचारू L1 नुकसान फ़ंक्शन है जिसे हम मान रहे हैं mshadow

इस विशेष नुकसान को एक यूनीरी या बाइनरी ऑपरेटर के रूप में लागू करना असंभव लगता है लेकिन एमएक्सनेट अपने उपयोगकर्ताओं को प्रतीकात्मक निष्पादन में स्वचालित भेदभाव प्रदान करता है जो सीधे एफ और एफ को नुकसान को सरल करता है। इसलिए हम निश्चित रूप से एक विशेष ऑपरेटर के रूप में इस विशेष नुकसान को लागू कर सकते हैं।

आकृतियाँ परिभाषित करना

जैसा कि हम जानते हैं कि एमएक्सनेट mshadow libraryस्पष्ट मेमोरी आवंटन की आवश्यकता होती है इसलिए किसी भी गणना के होने से पहले हमें सभी डेटा आकृतियों को प्रदान करने की आवश्यकता होती है। कार्यों और ढाल को परिभाषित करने से पहले, हमें निम्नानुसार इनपुट आकार स्थिरता और आउटपुट आकृति प्रदान करने की आवश्यकता है:

typedef mxnet::TShape (*UnaryShapeFunction)(const mxnet::TShape& src,
const EnvArguments& env);
   typedef mxnet::TShape (*BinaryShapeFunction)(const mxnet::TShape& lhs,
const mxnet::TShape& rhs,
const EnvArguments& env);

फ़ंक्शन mxnet :: Tshape का उपयोग इनपुट डेटा आकार और नामित आउटपुट डेटा आकार की जांच करने के लिए किया जाता है। मामले में, यदि आप इस फ़ंक्शन को परिभाषित नहीं करते हैं, तो डिफ़ॉल्ट आउटपुट आकार इनपुट आकार के समान होगा। उदाहरण के लिए, बाइनरी ऑपरेटर के मामले में, lhs और rhs का आकार डिफ़ॉल्ट रूप से समान है।

अब हम आगे बढ़ते हैं smooth l1 loss example. इसके लिए, हमें हेडर कार्यान्वयन में एक सीपीयू को सीपीयू या जीपीयू में परिभाषित करना होगा smooth_l1_unary-inl.h. इसका कारण समान कोड का पुन: उपयोग करना है smooth_l1_unary.cc तथा smooth_l1_unary.cu.

#include <mxnet/operator_util.h>
   #if defined(__CUDACC__)
      #define XPU gpu
   #else
      #define XPU cpu
#endif

जैसा कि हमारे में smooth l1 loss example,आउटपुट का स्रोत के समान आकार है, हम डिफ़ॉल्ट व्यवहार का उपयोग कर सकते हैं। इसे इस प्रकार लिखा जा सकता है -

inline mxnet::TShape SmoothL1Shape_(const mxnet::TShape& src,const EnvArguments& env) {
   return mxnet::TShape(src);
}

कार्य को परिभाषित करना

हम एक इनपुट के साथ एक यूनीरी या बाइनरी फ़ंक्शन बना सकते हैं -

typedef void (*UnaryFunction)(const TBlob& src,
   const EnvArguments& env,
   TBlob* ret,
   OpReqType req,
   RunContext ctx);
typedef void (*BinaryFunction)(const TBlob& lhs,
   const TBlob& rhs,
   const EnvArguments& env,
   TBlob* ret,
   OpReqType req,
   RunContext ctx);

निम्नलिखित है RunContext ctx struct जिसमें निष्पादन के लिए रनटाइम के दौरान आवश्यक जानकारी शामिल है -

struct RunContext {
   void *stream; // the stream of the device, can be NULL or Stream<gpu>* in GPU mode
   template<typename xpu> inline mshadow::Stream<xpu>* get_stream() // get mshadow stream from Context
} // namespace mxnet

अब, देखते हैं कि हम गणना परिणाम कैसे लिख सकते हैं ret

enum OpReqType {
   kNullOp, // no operation, do not write anything
   kWriteTo, // write gradient to provided space
   kWriteInplace, // perform an in-place write
   kAddTo // add to the provided space
};

अब, चलो हमारे लिए आगे बढ़ें smooth l1 loss example। इसके लिए, हम इस ऑपरेटर के कार्य को परिभाषित करने के लिए UnaryFunction का उपयोग करेंगे:

template<typename xpu>
void SmoothL1Forward_(const TBlob& src,
   const EnvArguments& env,
   TBlob *ret,
   OpReqType req,
RunContext ctx) {
   using namespace mshadow;
   using namespace mshadow::expr;
   mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
   real_t sigma2 = env.scalar * env.scalar;
   MSHADOW_TYPE_SWITCH(ret->type_flag_, DType, {
      mshadow::Tensor<xpu, 2, DType> out = ret->get<xpu, 2, DType>(s);
      mshadow::Tensor<xpu, 2, DType> in = src.get<xpu, 2, DType>(s);
      ASSIGN_DISPATCH(out, req,
      F<mshadow_op::smooth_l1_loss>(in, ScalarExp<DType>(sigma2)));
   });
}

ग्रेडिंग को परिभाषित करना

के सिवाय Input, TBlob, तथा OpReqTypeदोगुनी हो जाती है, बाइनरी ऑपरेटरों के ग्रेजुएट्स फ़ंक्शन में समान संरचना होती है। आइए नीचे देखें, जहां हमने विभिन्न प्रकार के इनपुट के साथ एक ढाल समारोह बनाया:

// depending only on out_grad
typedef void (*UnaryGradFunctionT0)(const OutputGrad& out_grad,
   const EnvArguments& env,
   TBlob* in_grad,
   OpReqType req,
   RunContext ctx);
// depending only on out_value
typedef void (*UnaryGradFunctionT1)(const OutputGrad& out_grad,
   const OutputValue& out_value,
   const EnvArguments& env,
   TBlob* in_grad,
   OpReqType req,
   RunContext ctx);
// depending only on in_data
typedef void (*UnaryGradFunctionT2)(const OutputGrad& out_grad,
   const Input0& in_data0,
   const EnvArguments& env,
   TBlob* in_grad,
   OpReqType req,
   RunContext ctx);

जैसा कि ऊपर बताया गया है Input0, Input, OutputValue, तथा OutputGrad सभी की संरचना साझा करते हैं GradientFunctionArgument. इसे निम्नानुसार परिभाषित किया गया है -

struct GradFunctionArgument {
   TBlob data;
}

अब हम आगे बढ़ते हैं smooth l1 loss example। इसके लिए ढाल के श्रृंखला नियम को सक्षम करने के लिए हमें गुणा करना होगाout_grad के परिणाम के लिए ऊपर से in_grad

template<typename xpu>
void SmoothL1BackwardUseIn_(const OutputGrad& out_grad, const Input0& in_data0,
   const EnvArguments& env,
   TBlob *in_grad,
   OpReqType req,
   RunContext ctx) {
   using namespace mshadow;
   using namespace mshadow::expr;
   mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
   real_t sigma2 = env.scalar * env.scalar;
      MSHADOW_TYPE_SWITCH(in_grad->type_flag_, DType, {
      mshadow::Tensor<xpu, 2, DType> src = in_data0.data.get<xpu, 2, DType>(s);
      mshadow::Tensor<xpu, 2, DType> ograd = out_grad.data.get<xpu, 2, DType>(s);
      mshadow::Tensor<xpu, 2, DType> igrad = in_grad->get<xpu, 2, DType>(s);
      ASSIGN_DISPATCH(igrad, req,
      ograd * F<mshadow_op::smooth_l1_gradient>(src, ScalarExp<DType>(sigma2)));
   });
}

पंजीकरण करें SimpleOp को MXNet पर

एक बार जब हमने आकार, फ़ंक्शन और ग्रेडिएंट बनाया, तो हमें उन्हें NDArray ऑपरेटर के साथ-साथ एक प्रतीकात्मक ऑपरेटर में पुनर्स्थापित करने की आवश्यकता है। इसके लिए, हम पंजीकरण मैक्रो का उपयोग निम्नानुसार कर सकते हैं -

MXNET_REGISTER_SIMPLE_OP(Name, DEV)
   .set_shape_function(Shape)
   .set_function(DEV::kDevMask, Function<XPU>, SimpleOpInplaceOption)
   .set_gradient(DEV::kDevMask, Gradient<XPU>, SimpleOpInplaceOption)
   .describe("description");

SimpleOpInplaceOption इस प्रकार परिभाषित किया जा सकता है -

enum SimpleOpInplaceOption {
   kNoInplace, // do not allow inplace in arguments
   kInplaceInOut, // allow inplace in with out (unary)
   kInplaceOutIn, // allow inplace out_grad with in_grad (unary)
   kInplaceLhsOut, // allow inplace left operand with out (binary)

   kInplaceOutLhs // allow inplace out_grad with lhs_grad (binary)
};

अब हम आगे बढ़ते हैं smooth l1 loss example। इसके लिए, हमारे पास एक ढाल फ़ंक्शन है जो इनपुट डेटा पर निर्भर करता है ताकि फ़ंक्शन को जगह में नहीं लिखा जा सके।

MXNET_REGISTER_SIMPLE_OP(smooth_l1, XPU)
.set_function(XPU::kDevMask, SmoothL1Forward_<XPU>, kNoInplace)
.set_gradient(XPU::kDevMask, SmoothL1BackwardUseIn_<XPU>, kInplaceOutIn)
.set_enable_scalar(true)
.describe("Calculate Smooth L1 Loss(lhs, scalar)");

EnvArguments पर SimpleOp

जैसा कि हम जानते हैं कि कुछ कार्यों के लिए निम्नलिखित की आवश्यकता हो सकती है -

  • एक स्केलर जैसे कि इनपुट एक ढाल के पैमाने पर

  • व्यवहार को नियंत्रित करने वाले कीवर्ड तर्कों का एक सेट

  • गणना को गति देने के लिए एक अस्थायी स्थान।

EnvArguments का उपयोग करने का लाभ यह है कि यह गणना को अधिक मापनीय और कुशल बनाने के लिए अतिरिक्त तर्क और संसाधन प्रदान करता है।

उदाहरण

पहले नीचे के रूप में संरचना को परिभाषित करते हैं -

struct EnvArguments {
   real_t scalar; // scalar argument, if enabled
   std::vector<std::pair<std::string, std::string> > kwargs; // keyword arguments
   std::vector<Resource> resource; // pointer to the resources requested
};

इसके बाद, हमें अतिरिक्त संसाधनों जैसे अनुरोध करने की आवश्यकता है mshadow::Random<xpu> और अस्थायी मेमोरी स्पेस से EnvArguments.resource. इसे निम्नानुसार किया जा सकता है -

struct ResourceRequest {
   enum Type { // Resource type, indicating what the pointer type is
      kRandom, // mshadow::Random<xpu> object
      kTempSpace // A dynamic temp space that can be arbitrary size
   };
   Type type; // type of resources
};

अब, पंजीकरण से घोषित संसाधन अनुरोध का अनुरोध किया जाएगा mxnet::ResourceManager. उसके बाद, यह संसाधनों को अंदर रखेगा std::vector<Resource> resource in EnvAgruments.

हम निम्नलिखित कोड की मदद से संसाधनों तक पहुँच सकते हैं -

auto tmp_space_res = env.resources[0].get_space(some_shape, some_stream);
auto rand_res = env.resources[0].get_random(some_stream);

यदि आप हमारे सुचारू l1 के नुकसान के उदाहरण में देखते हैं, तो हानि फ़ंक्शन के महत्वपूर्ण बिंदु को चिह्नित करने के लिए एक स्केलर इनपुट की आवश्यकता होती है। इसलिए पंजीकरण प्रक्रिया में, हम उपयोग करते हैंset_enable_scalar(true), तथा env.scalar समारोह और ढाल घोषणाओं में।

भवन निर्माण का संचालन

यहां यह सवाल उठता है कि हमें टेंसर संचालन की आवश्यकता क्यों है? कारण इस प्रकार हैं -

  • अभिकलन mshadow पुस्तकालय का उपयोग करता है और हमारे पास कभी-कभी आसानी से उपलब्ध कार्य नहीं होते हैं।

  • अगर सॉफ्टवेक्स लॉस और ग्रेडिएंट जैसे तत्व-वार तरीके से ऑपरेशन नहीं किया जाता है।

उदाहरण

यहां, हम उपरोक्त सुचारू l1 हानि उदाहरण का उपयोग कर रहे हैं। हम दो mappers बनाने जा रहे हैं अर्थात् चिकनी l1 नुकसान और ढाल के अदिश मामलों:

namespace mshadow_op {
   struct smooth_l1_loss {
      // a is x, b is sigma2
      MSHADOW_XINLINE static real_t Map(real_t a, real_t b) {
         if (a > 1.0f / b) {
            return a - 0.5f / b;
         } else if (a < -1.0f / b) {
            return -a - 0.5f / b;
         } else {
            return 0.5f * a * a * b;
         }
      }
   };
}