Apache MXNet-통합 운영자 API
이 장에서는 Apache MXNet의 통합 운영자 API (응용 프로그래밍 인터페이스)에 대한 정보를 제공합니다.
SimpleOp는 다양한 호출 프로세스를 통합하는 새로운 통합 운영자 API입니다. 호출되면 연산자의 기본 요소로 돌아갑니다. 통합 연산자는 단항 및 이항 연산을 위해 특별히 설계되었습니다. 대부분의 수학적 연산자가 하나 또는 두 개의 피연산자에 참여하고 더 많은 피연산자가 종속성과 관련된 최적화를 유용하게 만들기 때문입니다.
예제를 통해 SimpleOp 통합 연산자를 이해하게 될 것입니다. 이 예에서는 역할을하는 연산자를 만들 것입니다.smooth l1 loss, l1과 l2 손실의 혼합입니다. 다음과 같이 손실을 정의하고 작성할 수 있습니다.
loss = outside_weight .* f(inside_weight .* (data - label))
grad = outside_weight .* inside_weight .* f'(inside_weight .* (data - label))
여기 위의 예에서
. *는 요소 별 곱셈을 나타냅니다.
f, f’ 우리가 가정하고있는 부드러운 l1 손실 함수입니다. mshadow.
이 특정 손실을 단항 또는 이항 연산자로 구현하는 것은 불가능 해 보이지만 MXNet은 사용자에게 기호 실행에서 자동 차별화를 제공하여 f 및 f '에 대한 손실을 직접 단순화합니다. 그렇기 때문에이 특정 손실을 단항 연산자로 구현할 수 있습니다.
모양 정의
우리가 알고 있듯이 MXNet의 mshadow library명시적인 메모리 할당이 필요하므로 계산이 발생하기 전에 모든 데이터 형태를 제공해야합니다. 함수와 그라디언트를 정의하기 전에 다음과 같이 입력 모양 일관성과 출력 모양을 제공해야합니다.
typedef mxnet::TShape (*UnaryShapeFunction)(const mxnet::TShape& src,
const EnvArguments& env);
typedef mxnet::TShape (*BinaryShapeFunction)(const mxnet::TShape& lhs,
const mxnet::TShape& rhs,
const EnvArguments& env);
mxnet :: Tshape 함수는 입력 데이터 모양과 지정된 출력 데이터 모양을 확인하는 데 사용됩니다. 이 함수를 정의하지 않으면 기본 출력 모양이 입력 모양과 동일합니다. 예를 들어 이항 연산자의 경우 lhs 및 rhs의 모양은 기본적으로 동일하게 확인됩니다.
이제 우리의 smooth l1 loss example. 이를 위해 헤더 구현에서 XPU를 cpu 또는 gpu로 정의해야합니다. smooth_l1_unary-inl.h. 그 이유는 동일한 코드를 smooth_l1_unary.cc 과 smooth_l1_unary.cu.
#include <mxnet/operator_util.h>
#if defined(__CUDACC__)
#define XPU gpu
#define XPU cpu
우리와 마찬가지로 smooth l1 loss example,출력은 소스와 모양이 같으므로 기본 동작을 사용할 수 있습니다. 다음과 같이 작성할 수 있습니다.
inline mxnet::TShape SmoothL1Shape_(const mxnet::TShape& src,const EnvArguments& env) {
return mxnet::TShape(src);
함수 정의
다음과 같이 하나의 입력으로 단항 또는 이진 함수를 만들 수 있습니다.
typedef void (*UnaryFunction)(const TBlob& src,
const EnvArguments& env,
TBlob* ret,
OpReqType req,
RunContext ctx);
typedef void (*BinaryFunction)(const TBlob& lhs,
const TBlob& rhs,
const EnvArguments& env,
TBlob* ret,
OpReqType req,
RunContext ctx);
다음은 RunContext ctx struct 실행을 위해 런타임에 필요한 정보를 포함합니다-
struct RunContext {
void *stream; // the stream of the device, can be NULL or Stream<gpu>* in GPU mode
template<typename xpu> inline mshadow::Stream<xpu>* get_stream() // get mshadow stream from Context
} // namespace mxnet
이제 계산 결과를 작성하는 방법을 살펴 보겠습니다. ret.
enum OpReqType {
kNullOp, // no operation, do not write anything
kWriteTo, // write gradient to provided space
kWriteInplace, // perform an in-place write
kAddTo // add to the provided space
이제 우리의 smooth l1 loss example. 이를 위해 UnaryFunction을 사용하여이 연산자의 기능을 다음과 같이 정의합니다.
template<typename xpu>
void SmoothL1Forward_(const TBlob& src,
const EnvArguments& env,
TBlob *ret,
OpReqType req,
RunContext ctx) {
using namespace mshadow;
using namespace mshadow::expr;
mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
real_t sigma2 = env.scalar * env.scalar;
MSHADOW_TYPE_SWITCH(ret->type_flag_, DType, {
mshadow::Tensor<xpu, 2, DType> out = ret->get<xpu, 2, DType>(s);
mshadow::Tensor<xpu, 2, DType> in = src.get<xpu, 2, DType>(s);
F<mshadow_op::smooth_l1_loss>(in, ScalarExp<DType>(sigma2)));
그라디언트 정의
외 Input, TBlob, 과 OpReqType이항 연산자의 그라디언트 함수는 비슷한 구조를 가지고 있습니다. 아래에서 다양한 유형의 입력을 사용하여 그래디언트 함수를 만들었습니다.
// depending only on out_grad
typedef void (*UnaryGradFunctionT0)(const OutputGrad& out_grad,
const EnvArguments& env,
TBlob* in_grad,
OpReqType req,
RunContext ctx);
// depending only on out_value
typedef void (*UnaryGradFunctionT1)(const OutputGrad& out_grad,
const OutputValue& out_value,
const EnvArguments& env,
TBlob* in_grad,
OpReqType req,
RunContext ctx);
// depending only on in_data
typedef void (*UnaryGradFunctionT2)(const OutputGrad& out_grad,
const Input0& in_data0,
const EnvArguments& env,
TBlob* in_grad,
OpReqType req,
RunContext ctx);
위에 정의 된대로 Input0, Input, OutputValue, 과 OutputGrad 모두의 구조를 공유 GradientFunctionArgument. 다음과 같이 정의됩니다-
struct GradFunctionArgument {
TBlob data;
이제 우리의 smooth l1 loss example. 이를 위해 그라디언트의 체인 규칙을 활성화하려면out_grad 상단에서 결과까지 in_grad.
template<typename xpu>
void SmoothL1BackwardUseIn_(const OutputGrad& out_grad, const Input0& in_data0,
const EnvArguments& env,
TBlob *in_grad,
OpReqType req,
RunContext ctx) {
using namespace mshadow;
using namespace mshadow::expr;
mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
real_t sigma2 = env.scalar * env.scalar;
MSHADOW_TYPE_SWITCH(in_grad->type_flag_, DType, {
mshadow::Tensor<xpu, 2, DType> src = in_data0.data.get<xpu, 2, DType>(s);
mshadow::Tensor<xpu, 2, DType> ograd = out_grad.data.get<xpu, 2, DType>(s);
mshadow::Tensor<xpu, 2, DType> igrad = in_grad->get<xpu, 2, DType>(s);
ograd * F<mshadow_op::smooth_l1_gradient>(src, ScalarExp<DType>(sigma2)));
MXNet에 SimpleOp 등록
모양, 기능 및 그라디언트를 만든 후에는 NDArray 연산자와 기호 연산자로 복원해야합니다. 이를 위해 다음과 같이 등록 매크로를 사용할 수 있습니다.
.set_function(DEV::kDevMask, Function<XPU>, SimpleOpInplaceOption)
.set_gradient(DEV::kDevMask, Gradient<XPU>, SimpleOpInplaceOption)
그만큼 SimpleOpInplaceOption 다음과 같이 정의 할 수 있습니다-
enum SimpleOpInplaceOption {
kNoInplace, // do not allow inplace in arguments
kInplaceInOut, // allow inplace in with out (unary)
kInplaceOutIn, // allow inplace out_grad with in_grad (unary)
kInplaceLhsOut, // allow inplace left operand with out (binary)
kInplaceOutLhs // allow inplace out_grad with lhs_grad (binary)
이제 우리의 smooth l1 loss example. 이를 위해 입력 데이터에 의존하는 그래디언트 함수가 있으므로 함수를 제자리에 작성할 수 없습니다.
.set_function(XPU::kDevMask, SmoothL1Forward_<XPU>, kNoInplace)
.set_gradient(XPU::kDevMask, SmoothL1BackwardUseIn_<XPU>, kInplaceOutIn)
.describe("Calculate Smooth L1 Loss(lhs, scalar)");
EnvArguments에 대한 SimpleOp
우리가 알고 있듯이 일부 작업에는 다음이 필요할 수 있습니다.
그래디언트 스케일과 같은 입력으로서의 스칼라
동작을 제어하는 키워드 인수 세트
계산 속도를 높이기위한 임시 공간입니다.
EnvArguments 사용의 이점은 계산을보다 확장 가능하고 효율적으로 만들기 위해 추가 인수와 리소스를 제공한다는 것입니다.
먼저 아래와 같이 구조체를 정의 해 보겠습니다.
struct EnvArguments {
real_t scalar; // scalar argument, if enabled
std::vector<std::pair<std::string, std::string> > kwargs; // keyword arguments
std::vector<Resource> resource; // pointer to the resources requested
다음으로 다음과 같은 추가 리소스를 요청해야합니다. mshadow::Random<xpu> 및 임시 메모리 공간 EnvArguments.resource. 다음과 같이 할 수 있습니다-
struct ResourceRequest {
enum Type { // Resource type, indicating what the pointer type is
kRandom, // mshadow::Random<xpu> object
kTempSpace // A dynamic temp space that can be arbitrary size
Type type; // type of resources
이제 등록은 선언 된 리소스 요청을 mxnet::ResourceManager. 그 후 리소스를 std::vector<Resource> resource in EnvAgruments.
다음 코드의 도움으로 리소스에 액세스 할 수 있습니다.
auto tmp_space_res = env.resources[0].get_space(some_shape, some_stream);
auto rand_res = env.resources[0].get_random(some_stream);
부드러운 l1 손실 예제에서 보면 손실 함수의 전환점을 표시하기 위해 스칼라 입력이 필요합니다. 그래서 등록 과정에서set_enable_scalar(true), 및 env.scalar 함수 및 그라디언트 선언에서.
Tensor 운영 구축
여기서 우리가 텐서 연산을 만들어야하는 이유에 대한 질문이 생깁니다. 그 이유는 다음과 같습니다.
Computation은 mshadow 라이브러리를 사용하며 때때로 쉽게 사용할 수있는 함수가 없습니다.
소프트 맥스 손실 및 기울기와 같은 요소 별 방식으로 작업이 수행되지 않는 경우.
여기에서는 위의 부드러운 l1 손실 예제를 사용합니다. 부드러운 l1 손실과 기울기의 스칼라 케이스라는 두 개의 매퍼를 만들 것입니다.
namespace mshadow_op {
struct smooth_l1_loss {
// a is x, b is sigma2
MSHADOW_XINLINE static real_t Map(real_t a, real_t b) {
if (a > 1.0f / b) {
return a - 0.5f / b;
} else if (a < -1.0f / b) {
return -a - 0.5f / b;
} else {
return 0.5f * a * a * b;