Python API Autograd 및 이니셜 라이저

이 장에서는 MXNet의 autograd 및 initializer API를 다룹니다.

mxnet.autograd

이것은 NDArray를위한 MXNet의 autograd API입니다. 그것은 다음과 같은 클래스가 있습니다-

클래스 : Function ()

autograd에서 사용자 정의 차별화에 사용됩니다. 다음과 같이 쓸 수 있습니다.mxnet.autograd.Function. 어떤 이유로 든 사용자가 기본 체인 규칙에 의해 계산되는 기울기를 사용하지 않으려는 경우 mxnet.autograd의 Function 클래스를 사용하여 계산을위한 미분을 사용자 지정할 수 있습니다. Forward ()와 Backward ()라는 두 가지 메서드가 있습니다.

다음 요점의 도움으로이 클래스의 작업을 이해합시다.

  • 먼저 forward 메서드에서 계산을 정의해야합니다.

  • 그런 다음 역방향 방법으로 맞춤형 차별화를 제공해야합니다.

  • 이제 기울기 계산 중에 사용자 정의 역방향 함수 대신 mxnet.autograd는 사용자가 정의한 역방향 함수를 사용합니다. 또한 일부 작업을 앞뒤로 numpy 배열로 캐스트 할 수 있습니다.

Example

mxnet.autograd.function 클래스를 사용하기 전에 다음과 같이 역방향 및 순방향 메서드로 안정적인 시그 모이 드 함수를 정의 해 보겠습니다.

class sigmoid(mx.autograd.Function):
   def forward(self, x):
      y = 1 / (1 + mx.nd.exp(-x))
      self.save_for_backward(y)
      return y
   
   def backward(self, dy):
      y, = self.saved_tensors
      return dy * y * (1-y)

이제 함수 클래스는 다음과 같이 사용할 수 있습니다.

func = sigmoid()
x = mx.nd.random.uniform(shape=(10,))
x.attach_grad()
with mx.autograd.record():
m = func(x)
m.backward()
dx_grad = x.grad.asnumpy()
dx_grad

Output

코드를 실행하면 다음 출력이 표시됩니다.

array([0.21458015, 0.21291625, 0.23330082, 0.2361367 , 0.23086983,
0.24060014, 0.20326573, 0.21093895, 0.24968489, 0.24301809],
dtype=float32)

방법 및 매개 변수

다음은 mxnet.autogard.function 클래스의 메소드와 매개 변수입니다.

방법 및 매개 변수 정의
앞으로 (heads [, head_grads, retain_graph,…]) 이 방법은 순방향 계산에 사용됩니다.
뒤로 (heads [, head_grads, retain_graph,…]) 이 방법은 역방향 계산에 사용됩니다. 이전에 표시된 변수와 관련하여 헤드의 기울기를 계산합니다. 이 메서드는 순방향 출력만큼 ​​많은 입력을받습니다. 또한 순방향 입력만큼 많은 NDArray를 반환합니다.
get_symbol (x) 이 방법은 기록 된 계산 내역을 검색하는 데 사용됩니다. Symbol.
grad (헤드, 변수 [, head_grads,…]) 이 방법은 변수에 대한 헤드의 기울기를 계산합니다. 일단 계산되면 variable.grad에 저장하는 대신 그래디언트가 새 NDArray로 반환됩니다.
is_recording () 이 방법의 도움으로 우리는 기록이 아닌 기록 상태를 얻을 수 있습니다.
is_training () 이 방법의 도움으로 우리는 훈련 및 예측에 대한 상태를 얻을 수 있습니다.
mark_variables (변수, 그라디언트 [, grad_reqs]) 이 방법은 NDArray를 변수로 표시하여 autograd에 대한 기울기를 계산합니다. 이 메소드는 변수의 .attach_grad () 함수와 동일하지만 유일한 차이점은이 호출을 사용하여 그라디언트를 임의의 값으로 설정할 수 있다는 것입니다.
pause ([기차 모드]) 이 메서드는 계산할 그라데이션이 필요하지 않은 코드에 대해 'with'문에서 사용할 범위 컨텍스트를 반환합니다.
predict_mode () 이 메서드는 정방향 전달 동작이 추론 모드로 설정되고 기록 상태를 변경하지 않는 'with'문에서 사용할 범위 컨텍스트를 반환합니다.
기록 ([기차 _ 모드]) 그것은 autograd 'with'문에서 사용할 범위 컨텍스트를 기록하고 기울기를 계산해야하는 코드를 캡처합니다.
set_recording (기록 중) is_recoring ()과 유사하게,이 메소드의 도움으로 우리는 기록이 아닌 기록 상태를 얻을 수 있습니다.
set_training (is_training) is_traininig ()와 유사하게,이 메서드의 도움으로 상태를 훈련 또는 예측으로 설정할 수 있습니다.
train_mode () 이 메서드는 정방향 전달 동작이 훈련 모드로 설정되고 기록 상태를 변경하지 않는 'with'문에서 사용할 범위 컨텍스트를 반환합니다.

구현 예

아래 예제에서는 mxnet.autograd.grad () 메서드를 사용하여 변수에 대한 헤드의 기울기를 계산합니다.

x = mx.nd.ones((2,))
x.attach_grad()
with mx.autograd.record():
z = mx.nd.elemwise_add(mx.nd.exp(x), x)
dx_grad = mx.autograd.grad(z, [x], create_graph=True)
dx_grad

Output

출력은 아래에 언급되어 있습니다.

[
[3.7182817 3.7182817]
<NDArray 2 @cpu(0)>]

mxnet.autograd.predict_mode () 메서드를 사용하여 'with'문에서 사용할 범위를 반환 할 수 있습니다.

with mx.autograd.record():
y = model(x)
with mx.autograd.predict_mode():
y = sampling(y)
backward([y])

mxnet.intializer

계량 이니셜 라이저 용 MXNet API입니다. 그것은 다음과 같은 클래스가 있습니다-

클래스 및 매개 변수

다음은 방법 및 매개 변수입니다. mxnet.autogard.function 수업:

클래스 및 매개 변수 정의
쌍 선형 () 이 클래스의 도움으로 업 샘플링 레이어의 가중치를 초기화 할 수 있습니다.
상수 (값) 이 클래스는 가중치를 주어진 값으로 초기화합니다. 값은 설정할 매개 변수의 모양과 일치하는 NDArray 및 스칼라 일 수 있습니다.
FusedRNN (init, num_hidden, num_layers, 모드) 이름에서 알 수 있듯이이 클래스는 융합 된 RNN (Recurrent Neural Network) 계층에 대한 매개 변수를 초기화합니다.
InitDesc 초기화 패턴에 대한 설명자 역할을합니다.
이니셜 라이저 (** kwargs) 이니셜 라이저의 기본 클래스입니다.
LSTMBias ([forget_bias]) 이 클래스는 LSTMCell의 모든 바이어스를 0.0으로 초기화하지만 바이어스가 사용자 정의 값으로 설정된 잊어 버림 게이트를 제외합니다.
로드 (param [, default_init, verbose]) 이 클래스는 파일 또는 사전에서 데이터를로드하여 변수를 초기화합니다.
MSRAPrelu ([요인 _ 유형, 기울기]) 이름에서 알 수 있듯이이 클래스는 MSRA 용지에 따라 무게를 초기화합니다.
혼합 (패턴, 이니셜 라이저) 여러 이니셜 라이저를 사용하여 매개 변수를 초기화합니다.
일반 ([시그마]) Normal () 클래스는 평균이 0이고 표준 편차 (SD)가 다음과 같은 정규 분포에서 샘플링 된 임의 값으로 가중치를 초기화합니다. sigma.
하나() 매개 변수의 가중치를 1로 초기화합니다.
직교 ([scale, rand_type]) 이름에서 알 수 있듯이이 클래스는 가중치를 직교 행렬로 초기화합니다.
균일 ([스케일]) 주어진 범위에서 균일하게 샘플링 된 임의의 값으로 가중치를 초기화합니다.
Xavier ([rnd_type, factor_type, 크기]) 실제로 가중치에 대한 "Xavier"초기화를 수행하는 이니셜 라이저를 반환합니다.
제로() 매개 변수의 가중치를 0으로 초기화합니다.

구현 예

아래 예제에서는 mxnet.init.Normal () 클래스를 사용하여 이니셜 라이저를 생성하고 매개 변수를 검색합니다.

init = mx.init.Normal(0.8)
init.dumps()

Output

출력은 다음과 같습니다.

'["normal", {"sigma": 0.8}]'

Example

init = mx.init.Xavier(factor_type="in", magnitude=2.45)
init.dumps()

Output

출력은 다음과 같습니다.

'["xavier", {"rnd_type": "uniform", "factor_type": "in", "magnitude": 2.45}]'

아래 예제에서 mxnet.initializer.Mixed () 클래스를 사용하여 여러 이니셜 라이저를 사용하여 매개 변수를 초기화합니다.

init = mx.initializer.Mixed(['bias', '.*'], [mx.init.Zero(),
mx.init.Uniform(0.1)])
module.init_params(init)

for dictionary in module.get_params():
for key in dictionary:
print(key)
print(dictionary[key].asnumpy())

Output

출력은 다음과 같습니다.

fullyconnected1_weight
[[ 0.0097627 0.01856892 0.04303787]]
fullyconnected1_bias
[ 0.]