Apache MXNet-Python API 기호

이 장에서는 Symbol이라고하는 MXNet의 인터페이스에 대해 알아 봅니다.

Mxnet.ndarray

Apache MXNet의 Symbol API는 기호 프로그래밍을위한 인터페이스입니다. Symbol API는 다음을 사용합니다.

  • 계산 그래프

  • 메모리 사용량 감소

  • 사용 전 기능 최적화

아래의 예제는 MXNet의 Symbol API를 사용하여 간단한 표현식을 생성하는 방법을 보여줍니다.

정규 파이썬 목록에서 1-D 및 2-D '배열'을 사용하는 NDArray-

import mxnet as mx
# Two placeholders namely x and y will be created with mx.sym.variable
x = mx.sym.Variable('x')
y = mx.sym.Variable('y')
# The symbol here is constructed using the plus ‘+’ operator.
z = x + y

Output

다음 출력이 표시됩니다.

<Symbol _plus0>

Example

(x, y, z)

Output

출력은 다음과 같습니다.

(<Symbol x>, <Symbol y>, <Symbol _plus0>)

이제 MXNet의 ndarray API의 클래스, 함수 및 매개 변수에 대해 자세히 논의하겠습니다.

클래스

다음 표는 MXNet의 Symbol API 클래스로 구성되어 있습니다.

수업 정의
기호 (핸들) 이 클래스 즉 기호는 Apache MXNet의 기호 그래프입니다.

기능 및 매개 변수

다음은 mxnet.Symbol API에서 다루는 몇 가지 중요한 기능과 매개 변수입니다.

기능 및 매개 변수 정의
활성화 ([데이터, 행위 _ 유형, 출력, 이름]) 활성화 함수를 요소별로 입력에 적용합니다. 그것은 지원합니다relu, sigmoid, tanh, softrelu, softsign 활성화 기능.
BatchNorm ([데이터, 감마, 베타, 이동 _ 평균,…]) 일괄 정규화에 사용됩니다. 이 함수는 평균 및 분산으로 데이터 배치를 정규화합니다. 척도를 적용합니다gamma 및 오프셋 beta.
BilinearSampler ([데이터, 그리드, cudnn_off,…]) 이 함수는 입력 특성 맵에 이중 선형 샘플링을 적용합니다. 사실 그것은 "공간 트랜스포머 네트워크"의 핵심입니다. OpenCV의 remap 기능에 익숙하다면이 기능의 사용법은 그것과 매우 유사합니다. 유일한 차이점은 역방향 패스가 있다는 것입니다.
BlockGrad ([데이터, 출력, 이름]) 이름에서 알 수 있듯이이 함수는 기울기 계산을 중지합니다. 기본적으로 입력의 누적 기울기가이 연산자를 통해 역방향으로 흐르는 것을 막습니다.
cast ([데이터, dtype, 출력, 이름]) 이 함수는 입력의 모든 요소를 ​​새 유형으로 캐스팅합니다.
이 함수는 입력의 모든 요소를 ​​새 유형으로 캐스팅합니다. 이 함수는 지정된 이름으로 0으로 채워진 주어진 모양 및 유형의 새 기호를 반환합니다.
ones (shape [, dtype]) 이 함수는 이름이 지정된대로 지정된 모양과 유형의 새 기호를 반환하며, 하나의 기호로 채워집니다.
전체 (모양, val [, dtype]) 이 함수는 지정된 이름으로 주어진 값으로 채워진 주어진 모양과 유형의 새 배열을 반환합니다. val.
arange (시작 [, 중지, 단계, 반복,…]) 주어진 간격 내에서 균일 한 간격의 값을 반환합니다. 값은 반 개방 간격 (시작, 중지) 내에서 생성되며 이는 간격에 다음이 포함됨을 의미합니다.start 그러나 제외 stop.
linspace (시작, 중지, num [, 끝점, 이름,…]) 지정된 간격 내에서 균일 한 간격의 숫자를 반환합니다. array () 함수와 유사하게 반 개방 간격 [start, stop) 내에서 값이 생성되며 이는 간격에 다음이 포함됨을 의미합니다.start 그러나 제외 stop.
히스토그램 (a [, 빈, 범위]) 이름에서 알 수 있듯이이 함수는 입력 데이터의 히스토그램을 계산합니다.
power (base, exp) 이름에서 알 수 있듯이이 함수는 다음의 요소 별 결과를 반환합니다. base 다음에서 거듭 제곱 된 요소 exp요소. 두 입력, 즉 base와 exp는 모두 Symbol 또는 스칼라 일 수 있습니다. 여기서 방송은 허용되지 않습니다. 당신이 사용할 수있는broadcast_pow 방송 기능을 사용하려면
SoftmaxActivation ([데이터, 모드, 이름, 속성, 출력]) 이 함수는 소프트 맥스 활성화를 입력에 적용합니다. 내부 레이어 용입니다. 실제로 사용되지 않습니다.softmax() 대신.

구현 예

아래 예에서는 함수를 사용합니다. power() exp 요소에서 거듭 제곱 된 기본 요소의 요소 별 결과를 반환합니다.

import mxnet as mx
mx.sym.power(3, 5)

Output

다음 출력이 표시됩니다.

243

Example

x = mx.sym.Variable('x')
y = mx.sym.Variable('y')
z = mx.sym.power(x, 3)
z.eval(x=mx.nd.array([1,2]))[0].asnumpy()

Output

이것은 다음과 같은 출력을 생성합니다-

array([1., 8.], dtype=float32)

Example

z = mx.sym.power(4, y)
z.eval(y=mx.nd.array([2,3]))[0].asnumpy()

Output

위의 코드를 실행하면 다음 출력이 표시됩니다.

array([16., 64.], dtype=float32)

Example

z = mx.sym.power(x, y)
z.eval(x=mx.nd.array([4,5]), y=mx.nd.array([2,3]))[0].asnumpy()

Output

출력은 아래에 언급되어 있습니다.

array([ 16., 125.], dtype=float32)

아래 주어진 예에서는 함수를 사용합니다. SoftmaxActivation() (or softmax()) 입력에 적용되며 내부 레이어 용입니다.

input_data = mx.nd.array([[2., 0.9, -0.5, 4., 8.], [4., -.7, 9., 2., 0.9]])
soft_max_act = mx.nd.softmax(input_data)
print (soft_max_act.asnumpy())

Output

다음 출력이 표시됩니다.

[[2.4258138e-03 8.0748333e-04 1.9912292e-04 1.7924475e-02 9.7864312e-01]
[6.6843745e-03 6.0796250e-05 9.9204916e-01 9.0463174e-04 3.0112563e-04]]

symbol.contrib

Contrib NDArray API는 symbol.contrib 패키지에 정의되어 있습니다. 일반적으로 새로운 기능에 대한 많은 유용한 실험 API를 제공합니다. 이 API는 새로운 기능을 사용해 볼 수있는 커뮤니티의 장소로 작동합니다. 기능 기고자에게도 피드백이 제공됩니다.

기능 및 매개 변수

다음은 몇 가지 중요한 기능과 해당 매개 변수입니다. mxnet.symbol.contrib API

기능 및 매개 변수 정의
rand_zipfian (true_classes, num_sampled,…) 이 함수는 대략 Zipfian 분포에서 랜덤 샘플을 가져옵니다. 이 함수의 기본 분포는 Zipfian 분포입니다. 이 함수는 num_sampled 후보를 무작위로 샘플링하고 sampled_candidates의 요소는 위에 제공된 기본 분포에서 추출됩니다.
foreach (본문, 데이터, init_states) 이름에서 알 수 있듯이이 함수는 차원 0의 NDArray에 대해 사용자 정의 계산으로 루프를 실행합니다.이 함수는 for 루프를 시뮬레이션하고 본문에는 for 루프의 반복에 대한 계산이 있습니다.
while_loop (cond, func, loop_vars [,…]) 이름에서 알 수 있듯이이 함수는 사용자 정의 계산 및 루프 조건으로 while 루프를 실행합니다. 이 함수는 조건이 충족되면 문자 그대로 사용자 정의 된 계산을 수행하는 while 루프를 시뮬레이션합니다.
cond (pred, then_func, else_func) 이름에서 알 수 있듯이이 함수는 사용자 정의 조건 및 계산을 사용하여 if-then-else를 실행합니다. 이 함수는 지정된 조건에 따라 두 개의 사용자 정의 계산 중 하나를 수행하도록 선택하는 if-like 분기를 시뮬레이션합니다.
getnnz ([데이터, 축, 출력, 이름]) 이 함수는 희소 텐서에 대해 저장된 값의 수를 제공합니다. 또한 명시적인 0도 포함됩니다. CPU에서 CSR 매트릭스 만 지원합니다.
requantize ([데이터, 최소 _ 범위, 최대 _ 범위,…]) 이 함수는 런타임 또는 교정에서 계산 된 최소 및 최대 임계 값을 사용하여 int32 및 해당 임계 값으로 양자화 된 주어진 데이터를 int8로 재 양자화합니다.
index_copy ([old_tensor, index_vector,…]) 이 함수는 new_tensor into the old_tensor by selecting the indices in the order given in index. The output of this operator will be a new tensor that contains the rest elements of old tensor and the copied elements of new tensor.
interleaved_matmul_encdec_qk ([쿼리,…]) 이 연산자는 인코더-디코더로 다중 머리주의 사용에서 쿼리와 키의 투영 사이의 행렬 곱셈을 계산합니다. 조건은 입력이 레이아웃 ((seq_length, batch_size, num_heads *, head_dim)을 따르는 쿼리 프로젝션의 텐서)이어야한다는 것입니다.

구현 예

아래 예제에서 우리는 대략 Zipfian 분포에서 무작위 샘플을 그리기 위해 rand_zipfian 함수를 사용할 것입니다.

import mxnet as mx
true_cls = mx.sym.Variable('true_cls')
samples, exp_count_true, exp_count_sample = mx.sym.contrib.rand_zipfian(true_cls, 5, 6)
samples.eval(true_cls=mx.nd.array([3]))[0].asnumpy()

Output

다음 출력이 표시됩니다.

array([4, 0, 2, 1, 5], dtype=int64)

Example

exp_count_true.eval(true_cls=mx.nd.array([3]))[0].asnumpy()

Output

출력은 아래에 언급되어 있습니다.

array([0.57336551])

Example

exp_count_sample.eval(true_cls=mx.nd.array([3]))[0].asnumpy()

Output

다음 출력이 표시됩니다.

array([1.78103594, 0.46847373, 1.04183923, 0.57336551, 1.04183923])

아래 예에서는 함수를 사용합니다. while_loop 사용자 정의 계산 및 루프 조건을위한 while 루프 실행-

cond = lambda i, s: i <= 7
func = lambda i, s: ([i + s], [i + 1, s + i])
loop_vars = (mx.sym.var('i'), mx.sym.var('s'))
outputs, states = mx.sym.contrib.while_loop(cond, func, loop_vars, max_iterations=10)
print(outputs)

Output

출력은 다음과 같습니다.

[<Symbol _while_loop0>]

Example

Print(States)

Output

이것은 다음과 같은 출력을 생성합니다-

[<Symbol _while_loop0>, <Symbol _while_loop0>]

아래 예에서는 함수를 사용합니다. index_copy new_tensor의 요소를 old_tensor에 복사합니다.

import mxnet as mx
a = mx.nd.zeros((6,3))
b = mx.nd.array([[1,2,3],[4,5,6],[7,8,9]])
index = mx.nd.array([0,4,2])
mx.nd.contrib.index_copy(a, index, b)

Output

위의 코드를 실행하면 다음 출력이 표시됩니다.

[[1. 2. 3.]
[0. 0. 0.]
[7. 8. 9.]
[0. 0. 0.]
[4. 5. 6.]
[0. 0. 0.]]
<NDArray 6x3 @cpu(0)>

symbol.image

Image Symbol API는 symbol.image 패키지에 정의되어 있습니다. 이름에서 알 수 있듯이 일반적으로 이미지와 기능에 사용됩니다.

기능 및 매개 변수

다음은 몇 가지 중요한 기능과 해당 매개 변수입니다. mxnet.symbol.image API

기능 및 매개 변수 정의
adjust_lighting ([데이터, 알파, 출력, 이름]) 이름에서 알 수 있듯이이 기능은 입력의 조명 수준을 조정합니다. AlexNet 스타일을 따릅니다.
자르기 ([데이터, x, y, 너비, 높이, 출력, 이름]) 이 기능의 도움으로 우리는 이미지 NDArray of shape (H x W x C) 또는 (N x H x W x C)를 사용자가 지정한 크기로자를 수 있습니다.
normalize ([데이터, 평균, 표준, 출력, 이름]) 모양의 텐서 (C x H x W) 또는 (N x C x H x W)를 다음과 같이 정규화합니다. meanstandard deviation(SD).
random_crop ([데이터, xrange, yrange, 너비,…]) crop ()과 유사하게, 이미지 NDArray of shape (H x W x C) 또는 (N x H x W x C)를 사용자가 지정한 크기로 무작위로 자릅니다. 다음과 같은 경우 결과를 업 샘플링합니다.src 보다 작습니다 size.
random_lighting([데이터, alpha_std, 출력, 이름]) 이름에서 알 수 있듯이이 기능은 PCA 노이즈를 무작위로 추가합니다. 또한 AlexNet 스타일을 따릅니다.
random_resized_crop ([데이터, xrange, yrange,…]) 또한 이미지를 임의의 NDArray of shape (H x W x C) 또는 (N x H x W x C)로 지정된 크기로 자릅니다. src가 크기보다 작 으면 결과를 업 샘플링합니다. 면적과 종횡비도 무작위로 지정합니다.
resize ([데이터, 크기, 유지 _ 비율, interp,…]) 이름에서 알 수 있듯이이 기능은 이미지 NDArray of shape (H x W x C) 또는 (N x H x W x C)를 사용자가 지정한 크기로 조정합니다.
to_tensor ([데이터, 출력, 이름]) [0, 255] 범위의 값을 가진 이미지 NDArray of shape (H x W x C) 또는 (N x H x W x C)를 텐서 NDArray of shape (C x H x W) 또는 ( N x C x H x W) 범위의 값으로 [0, 1].

구현 예

아래 예에서는 to_tensor 함수를 사용하여 [0, 255] 범위의 값을 가진 이미지 NDArray (H x W x C) 또는 (N x H x W x C)를 텐서 NDArray로 변환합니다. [0, 1] 범위의 값을 가진 모양 (C x H x W) 또는 (N x C x H x W).

import numpy as np

img = mx.sym.random.uniform(0, 255, (4, 2, 3)).astype(dtype=np.uint8)

mx.sym.image.to_tensor(img)

Output

출력은 다음과 같습니다.

<Symbol to_tensor4>

Example

img = mx.sym.random.uniform(0, 255, (2, 4, 2, 3)).astype(dtype=np.uint8)

mx.sym.image.to_tensor(img)

Output

출력은 다음과 같습니다.

<Symbol to_tensor5>

아래 예제에서는 normalize () 함수를 사용하여 (C x H x W) 또는 (N x C x H x W) 모양의 텐서를 정규화합니다. meanstandard deviation(SD).

img = mx.sym.random.uniform(0, 1, (3, 4, 2))

mx.sym.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))

Output

다음은 코드의 출력입니다.

<Symbol normalize0>

Example

img = mx.sym.random.uniform(0, 1, (2, 3, 4, 2))

mx.sym.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))

Output

출력은 다음과 같습니다.

<Symbol normalize1>

symbol.random

Random Symbol API는 symbol.random 패키지에 정의되어 있습니다. 이름에서 알 수 있듯이 MXNet의 Random Distribution Generator Symbol API입니다.

기능 및 매개 변수

다음은 몇 가지 중요한 기능과 해당 매개 변수입니다. mxnet.symbol.random API

기능 및 매개 변수 정의
uniform ([낮음, 높음, 모양, dtype, ctx, out]) 균일 분포에서 무작위 샘플을 생성합니다.
노멀 ([loc, scale, shape, dtype, ctx, out]) 정규 (가우스) 분포에서 무작위 샘플을 생성합니다.
randn (* 모양, ** kwargs) 정규 (가우스) 분포에서 무작위 샘플을 생성합니다.
포아송 ([lam, shape, dtype, ctx, out]) 포아송 분포에서 무작위 샘플을 생성합니다.
지수 ([스케일, 모양, dtype, ctx, out]) 지수 분포에서 샘플을 생성합니다.
감마 ([알파, 베타, 모양, dtype, ctx, out]) 감마 분포에서 무작위 샘플을 생성합니다.
다항식 (데이터 [, 모양, get_prob, out, dtype]) 여러 다항 분포에서 동시 샘플링을 생성합니다.
음 이항 ([k, p, 모양, dtype, ctx, out]) 음 이항 분포에서 무작위 샘플을 생성합니다.
generalized_negative_binomial ([mu, alpha,…]) 일반화 된 음 이항 분포에서 무작위 샘플을 생성합니다.
shuffle (데이터, ** kwargs) 요소를 무작위로 섞습니다.
randint (낮음, 높음 [, 모양, dtype, ctx, out]) 이산 균일 분포에서 무작위 샘플을 생성합니다.
exponential_like ([데이터, 램, 아웃, 이름]) 입력 배열 모양에 따라 지수 분포에서 무작위 샘플을 생성합니다.
gamma_like ([데이터, 알파, 베타, 출력, 이름]) 입력 배열 모양에 따라 감마 분포에서 무작위 샘플을 생성합니다.
generalized_negative_binomial_like ([데이터,…]) 입력 배열 모양에 따라 일반화 된 음 이항 분포에서 랜덤 샘플을 생성합니다.
negative_binomial_like ([데이터, k, p, 출력, 이름]) 입력 배열 모양에 따라 음의 이항 분포에서 무작위 샘플을 생성합니다.
normal_like ([데이터, 위치, 스케일, 아웃, 이름]) 입력 배열 모양에 따라 정규 (가우시안) 분포에서 무작위 샘플을 생성합니다.
poisson_like ([데이터, 램, 아웃, 이름]) 입력 배열 모양에 따라 포아송 분포에서 랜덤 샘플을 생성합니다.
uniform_like ([데이터, 낮음, 높음, 출력, 이름]) 입력 배열 모양에 따라 균등 분포에서 무작위 샘플을 생성합니다.

구현 예

아래 예에서는 shuffle () 함수를 사용하여 요소를 무작위로 섞을 것입니다. 첫 번째 축을 따라 배열을 섞습니다.

data = mx.nd.array([[0, 1, 2], [3, 4, 5], [6, 7, 8],[9,10,11]])
x = mx.sym.Variable('x')
y = mx.sym.random.shuffle(x)
y.eval(x=data)

Output

다음 출력이 표시됩니다.

[
[[ 9. 10. 11.]
[ 0. 1. 2.]
[ 6. 7. 8.]
[ 3. 4. 5.]]
<NDArray 4x3 @cpu(0)>]

Example

y.eval(x=data)

Output

위의 코드를 실행하면 다음 출력이 표시됩니다.

[
[[ 6. 7. 8.]
[ 0. 1. 2.]
[ 3. 4. 5.]
[ 9. 10. 11.]]
<NDArray 4x3 @cpu(0)>]

아래 예에서는 일반화 된 음 이항 분포에서 무작위 샘플을 추출합니다. 이를 위해 기능을 사용합니다.generalized_negative_binomial().

mx.sym.random.generalized_negative_binomial(10, 0.1)

Output

출력은 다음과 같습니다.

<Symbol _random_generalized_negative_binomial0>

symbol.sparse

Sparse Symbol API는 mxnet.symbol.sparse 패키지에 정의되어 있습니다. 이름에서 알 수 있듯이 CPU에서 희소 신경망 그래프와 자동 차별화를 제공합니다.

기능 및 매개 변수

다음은 몇 가지 중요한 기능 (기호 생성 루틴, 기호 조작 루틴, 수학 함수, 삼각 함수, 하이버 볼릭 함수, 축소 함수, 반올림, 거듭 제곱, 신경망 포함)과 해당 매개 변수입니다. mxnet.symbol.sparse API

기능 및 매개 변수 정의
ElementWiseSum (* args, ** kwargs) 이 함수는 모든 입력 인수 요소를 현명하게 추가합니다. 예 : _ (1,2,… = 1 + 2 + ⋯ +). 여기에서 add_n이 add를 n 번 호출하는 것보다 잠재적으로 더 효율적임을 알 수 있습니다.
임베딩 ([데이터, 가중치, 입력 _ 치수,…]) 정수 인덱스를 벡터 표현, 즉 임베딩에 매핑합니다. 실제로 단어 임베딩이라고하는 고차원 공간의 실수 벡터에 단어를 매핑합니다.
LinearRegressionOutput ([데이터, 레이블,…]) 역방향 전파 중 손실 제곱을 계산하고 최적화하여 순방향 전파 중에 출력 데이터 만 제공합니다.
LogisticRegressionOutput ([데이터, 레이블,…]) 시그 모이 드 함수라고도하는 로지스틱 함수를 입력에 적용합니다. 함수는 1 / 1 + exp (-x)로 계산됩니다.
MAERegressionOutput ([데이터, 레이블,…]) 이 연산자는 입력의 평균 절대 오차를 계산합니다. MAE는 실제로 절대 오차의 예상 값에 해당하는 위험 메트릭입니다.
abs ([데이터, 이름, 속성, 출력]) 이름에서 알 수 있듯이이 함수는 입력의 요소 별 절대 값을 반환합니다.
adagrad_update ([weight, grad, history, lr,…]) 업데이트 기능입니다. AdaGrad optimizer.
adam_update ([weight, grad, mean, var, lr,…]) 업데이트 기능입니다. Adam optimizer.
add_n (* args, ** kwargs) 이름에서 알 수 있듯이 모든 입력 인수를 요소별로 추가합니다.
arccos ([데이터, 이름, 속성, 출력]) 이 함수는 입력 배열의 요소 별 역 코사인을 반환합니다.
dot ([lhs, rhs, transpose_a, transpose_b,…]) 이름에서 알 수 있듯이 두 배열의 내적을 제공합니다. 입력 배열 차원에 따라 달라집니다. 1-D : 벡터의 내적 2-D : 행렬 곱셈 ND : 첫 번째 입력의 마지막 축과 두 번째 입력의 첫 번째 축에 대한 합산.
elemwise_add ([lhs, rhs, 이름, 속성, 출력]) 이름에서 알 수 있듯이 add 인수 요소 현명.
elemwise_div ([lhs, rhs, 이름, 속성, 출력]) 이름에서 알 수 있듯이 divide 인수 요소 현명.
elemwise_mul ([lhs, rhs, 이름, 속성, 출력]) 이름에서 알 수 있듯이 Multiply 인수 요소 현명.
elemwise_sub ([lhs, rhs, 이름, 속성, 출력]) 이름에서 알 수 있듯이 인수 요소를 현명하게 뺍니다.
exp ([데이터, 이름, 속성, 출력]) 이 함수는 주어진 입력의 요소 별 지수 값을 반환합니다.
sgd_update ([weight, grad, lr, wd,…]) Stochastic Gradient Descent Optimizer의 업데이트 기능으로 작동합니다.
sigmoid ([데이터, 이름, 속성, 출력]) 이름에서 알 수 있듯이 sigmoid x 요소 현명한.
sign ([데이터, 이름, 속성, 출력]) 주어진 입력의 요소 현명한 부호를 반환합니다.
sin ([데이터, 이름, 속성, 출력]) 이름에서 알 수 있듯이이 함수는 주어진 입력 배열의 요소 현명한 사인을 계산합니다.

구현 예

아래 예에서는 다음을 사용하여 요소를 무작위로 섞을 것입니다. ElementWiseSum()함수. 정수 인덱스를 벡터 표현, 즉 단어 임베딩에 매핑합니다.

input_dim = 4
output_dim = 5

Example

/* Here every row in weight matrix y represents a word. So, y = (w0,w1,w2,w3)
y = [[ 0., 1., 2., 3., 4.],
[ 5., 6., 7., 8., 9.],
[ 10., 11., 12., 13., 14.],
[ 15., 16., 17., 18., 19.]]
/* Here input array x represents n-grams(2-gram). So, x = [(w1,w3), (w0,w2)]
x = [[ 1., 3.],
[ 0., 2.]]
/* Now, Mapped input x to its vector representation y.
Embedding(x, y, 4, 5) = [[[ 5., 6., 7., 8., 9.],
[ 15., 16., 17., 18., 19.]],
[[ 0., 1., 2., 3., 4.],
[ 10., 11., 12., 13., 14.]]]