Python API Autograd 및 이니셜 라이저
이 장에서는 MXNet의 autograd 및 initializer API를 다룹니다.
mxnet.autograd
이것은 NDArray를위한 MXNet의 autograd API입니다. 그것은 다음과 같은 클래스가 있습니다-
클래스 : Function ()
autograd에서 사용자 정의 차별화에 사용됩니다. 다음과 같이 쓸 수 있습니다.mxnet.autograd.Function. 어떤 이유로 든 사용자가 기본 체인 규칙에 의해 계산되는 기울기를 사용하지 않으려는 경우 mxnet.autograd의 Function 클래스를 사용하여 계산을위한 미분을 사용자 지정할 수 있습니다. Forward ()와 Backward ()라는 두 가지 메서드가 있습니다.
다음 요점의 도움으로이 클래스의 작업을 이해합시다.
먼저 forward 메서드에서 계산을 정의해야합니다.
그런 다음 역방향 방법으로 맞춤형 차별화를 제공해야합니다.
이제 기울기 계산 중에 사용자 정의 역방향 함수 대신 mxnet.autograd는 사용자가 정의한 역방향 함수를 사용합니다. 또한 일부 작업을 앞뒤로 numpy 배열로 캐스트 할 수 있습니다.
Example
mxnet.autograd.function 클래스를 사용하기 전에 다음과 같이 역방향 및 순방향 메서드로 안정적인 시그 모이 드 함수를 정의 해 보겠습니다.
class sigmoid(mx.autograd.Function):
def forward(self, x):
y = 1 / (1 + mx.nd.exp(-x))
self.save_for_backward(y)
return y
def backward(self, dy):
y, = self.saved_tensors
return dy * y * (1-y)
이제 함수 클래스는 다음과 같이 사용할 수 있습니다.
func = sigmoid()
x = mx.nd.random.uniform(shape=(10,))
x.attach_grad()
with mx.autograd.record():
m = func(x)
m.backward()
dx_grad = x.grad.asnumpy()
dx_grad
Output
코드를 실행하면 다음 출력이 표시됩니다.
array([0.21458015, 0.21291625, 0.23330082, 0.2361367 , 0.23086983,
0.24060014, 0.20326573, 0.21093895, 0.24968489, 0.24301809],
dtype=float32)
방법 및 매개 변수
다음은 mxnet.autogard.function 클래스의 메소드와 매개 변수입니다.
방법 및 매개 변수 | 정의 |
---|---|
앞으로 (heads [, head_grads, retain_graph,…]) | 이 방법은 순방향 계산에 사용됩니다. |
뒤로 (heads [, head_grads, retain_graph,…]) | 이 방법은 역방향 계산에 사용됩니다. 이전에 표시된 변수와 관련하여 헤드의 기울기를 계산합니다. 이 메서드는 순방향 출력만큼 많은 입력을받습니다. 또한 순방향 입력만큼 많은 NDArray를 반환합니다. |
get_symbol (x) | 이 방법은 기록 된 계산 내역을 검색하는 데 사용됩니다. Symbol. |
grad (헤드, 변수 [, head_grads,…]) | 이 방법은 변수에 대한 헤드의 기울기를 계산합니다. 일단 계산되면 variable.grad에 저장하는 대신 그래디언트가 새 NDArray로 반환됩니다. |
is_recording () | 이 방법의 도움으로 우리는 기록이 아닌 기록 상태를 얻을 수 있습니다. |
is_training () | 이 방법의 도움으로 우리는 훈련 및 예측에 대한 상태를 얻을 수 있습니다. |
mark_variables (변수, 그라디언트 [, grad_reqs]) | 이 방법은 NDArray를 변수로 표시하여 autograd에 대한 기울기를 계산합니다. 이 메소드는 변수의 .attach_grad () 함수와 동일하지만 유일한 차이점은이 호출을 사용하여 그라디언트를 임의의 값으로 설정할 수 있다는 것입니다. |
pause ([기차 모드]) | 이 메서드는 계산할 그라데이션이 필요하지 않은 코드에 대해 'with'문에서 사용할 범위 컨텍스트를 반환합니다. |
predict_mode () | 이 메서드는 정방향 전달 동작이 추론 모드로 설정되고 기록 상태를 변경하지 않는 'with'문에서 사용할 범위 컨텍스트를 반환합니다. |
기록 ([기차 _ 모드]) | 그것은 autograd 'with'문에서 사용할 범위 컨텍스트를 기록하고 기울기를 계산해야하는 코드를 캡처합니다. |
set_recording (기록 중) | is_recoring ()과 유사하게,이 메소드의 도움으로 우리는 기록이 아닌 기록 상태를 얻을 수 있습니다. |
set_training (is_training) | is_traininig ()와 유사하게,이 메서드의 도움으로 상태를 훈련 또는 예측으로 설정할 수 있습니다. |
train_mode () | 이 메서드는 정방향 전달 동작이 훈련 모드로 설정되고 기록 상태를 변경하지 않는 'with'문에서 사용할 범위 컨텍스트를 반환합니다. |
구현 예
아래 예제에서는 mxnet.autograd.grad () 메서드를 사용하여 변수에 대한 헤드의 기울기를 계산합니다.
x = mx.nd.ones((2,))
x.attach_grad()
with mx.autograd.record():
z = mx.nd.elemwise_add(mx.nd.exp(x), x)
dx_grad = mx.autograd.grad(z, [x], create_graph=True)
dx_grad
Output
출력은 아래에 언급되어 있습니다.
[
[3.7182817 3.7182817]
<NDArray 2 @cpu(0)>]
mxnet.autograd.predict_mode () 메서드를 사용하여 'with'문에서 사용할 범위를 반환 할 수 있습니다.
with mx.autograd.record():
y = model(x)
with mx.autograd.predict_mode():
y = sampling(y)
backward([y])
mxnet.intializer
계량 이니셜 라이저 용 MXNet API입니다. 그것은 다음과 같은 클래스가 있습니다-
클래스 및 매개 변수
다음은 방법 및 매개 변수입니다. mxnet.autogard.function 수업:
클래스 및 매개 변수 | 정의 |
---|---|
쌍 선형 () | 이 클래스의 도움으로 업 샘플링 레이어의 가중치를 초기화 할 수 있습니다. |
상수 (값) | 이 클래스는 가중치를 주어진 값으로 초기화합니다. 값은 설정할 매개 변수의 모양과 일치하는 NDArray 및 스칼라 일 수 있습니다. |
FusedRNN (init, num_hidden, num_layers, 모드) | 이름에서 알 수 있듯이이 클래스는 융합 된 RNN (Recurrent Neural Network) 계층에 대한 매개 변수를 초기화합니다. |
InitDesc | 초기화 패턴에 대한 설명자 역할을합니다. |
이니셜 라이저 (** kwargs) | 이니셜 라이저의 기본 클래스입니다. |
LSTMBias ([forget_bias]) | 이 클래스는 LSTMCell의 모든 바이어스를 0.0으로 초기화하지만 바이어스가 사용자 정의 값으로 설정된 잊어 버림 게이트를 제외합니다. |
로드 (param [, default_init, verbose]) | 이 클래스는 파일 또는 사전에서 데이터를로드하여 변수를 초기화합니다. |
MSRAPrelu ([요인 _ 유형, 기울기]) | 이름에서 알 수 있듯이이 클래스는 MSRA 용지에 따라 무게를 초기화합니다. |
혼합 (패턴, 이니셜 라이저) | 여러 이니셜 라이저를 사용하여 매개 변수를 초기화합니다. |
일반 ([시그마]) | Normal () 클래스는 평균이 0이고 표준 편차 (SD)가 다음과 같은 정규 분포에서 샘플링 된 임의 값으로 가중치를 초기화합니다. sigma. |
하나() | 매개 변수의 가중치를 1로 초기화합니다. |
직교 ([scale, rand_type]) | 이름에서 알 수 있듯이이 클래스는 가중치를 직교 행렬로 초기화합니다. |
균일 ([스케일]) | 주어진 범위에서 균일하게 샘플링 된 임의의 값으로 가중치를 초기화합니다. |
Xavier ([rnd_type, factor_type, 크기]) | 실제로 가중치에 대한 "Xavier"초기화를 수행하는 이니셜 라이저를 반환합니다. |
제로() | 매개 변수의 가중치를 0으로 초기화합니다. |
구현 예
아래 예제에서는 mxnet.init.Normal () 클래스를 사용하여 이니셜 라이저를 생성하고 매개 변수를 검색합니다.
init = mx.init.Normal(0.8)
init.dumps()
Output
출력은 다음과 같습니다.
'["normal", {"sigma": 0.8}]'
Example
init = mx.init.Xavier(factor_type="in", magnitude=2.45)
init.dumps()
Output
출력은 다음과 같습니다.
'["xavier", {"rnd_type": "uniform", "factor_type": "in", "magnitude": 2.45}]'
아래 예제에서 mxnet.initializer.Mixed () 클래스를 사용하여 여러 이니셜 라이저를 사용하여 매개 변수를 초기화합니다.
init = mx.initializer.Mixed(['bias', '.*'], [mx.init.Zero(),
mx.init.Uniform(0.1)])
module.init_params(init)
for dictionary in module.get_params():
for key in dictionary:
print(key)
print(dictionary[key].asnumpy())
Output
출력은 다음과 같습니다.
fullyconnected1_weight
[[ 0.0097627 0.01856892 0.04303787]]
fullyconnected1_bias
[ 0.]