Python API Autograd dan Penginisialisasi

Bab ini membahas tentang autograd dan API penginisialisasi di MXNet.

mxnet.autograd

Ini adalah API autograd MXNet untuk NDArray. Ini memiliki kelas berikut -

Kelas: Fungsi ()

Ini digunakan untuk diferensiasi khusus dalam autograd. Dapat ditulis sebagaimxnet.autograd.Function. Jika, karena alasan apa pun, pengguna tidak ingin menggunakan gradien yang dihitung oleh aturan rantai default, maka dia dapat menggunakan kelas Fungsi mxnet.autograd untuk menyesuaikan diferensiasi untuk komputasi. Ini memiliki dua metode yaitu Forward () dan Backward ().

Marilah kita memahami pekerjaan kelas ini dengan bantuan poin-poin berikut -

  • Pertama, kita perlu mendefinisikan perhitungan kita dalam metode maju.

  • Kemudian, kami perlu memberikan diferensiasi yang disesuaikan dalam metode mundur.

  • Sekarang selama komputasi gradien, alih-alih fungsi mundur yang ditentukan pengguna, mxnet.autograd akan menggunakan fungsi mundur yang ditentukan oleh pengguna. Kami juga dapat melakukan cast ke numpy array dan back untuk beberapa operasi maju maupun mundur.

Example

Sebelum menggunakan kelas mxnet.autograd.function, mari kita definisikan fungsi sigmoid stabil dengan metode mundur dan maju sebagai berikut -

class sigmoid(mx.autograd.Function):
   def forward(self, x):
      y = 1 / (1 + mx.nd.exp(-x))
      self.save_for_backward(y)
      return y
   
   def backward(self, dy):
      y, = self.saved_tensors
      return dy * y * (1-y)

Sekarang, kelas fungsi dapat digunakan sebagai berikut -

func = sigmoid()
x = mx.nd.random.uniform(shape=(10,))
x.attach_grad()
with mx.autograd.record():
m = func(x)
m.backward()
dx_grad = x.grad.asnumpy()
dx_grad

Output

Saat Anda menjalankan kode, Anda akan melihat output berikut -

array([0.21458015, 0.21291625, 0.23330082, 0.2361367 , 0.23086983,
0.24060014, 0.20326573, 0.21093895, 0.24968489, 0.24301809],
dtype=float32)

Metode dan parameternya

Berikut adalah metode dan parameter kelas mxnet.autogard.function -

Metode dan Parameternya Definisi
maju (kepala [, head_grads, mempertahankan_graf,…]) Metode ini digunakan untuk komputasi maju.
mundur (kepala [, head_grads, mempertahankan_graf,…]) Metode ini digunakan untuk komputasi mundur. Ini menghitung gradien kepala sehubungan dengan variabel yang ditandai sebelumnya. Metode ini mengambil masukan sebanyak keluaran maju. Ini juga mengembalikan sebanyak NDArray sebagai input ke depan.
get_symbol (x) Metode ini digunakan untuk mengambil riwayat komputasi yang direkam sebagai Symbol.
grad (kepala, variabel [, head_grads,…]) Metode ini menghitung gradien kepala sehubungan dengan variabel. Setelah dihitung, alih-alih menyimpan ke variable.grad, gradien akan dikembalikan sebagai NDArrays baru.
is_recording () Dengan bantuan metode ini kita bisa mendapatkan status merekam dan bukan merekam.
is_training () Dengan bantuan metode ini kita bisa mendapatkan status pelatihan dan prediksi.
mark_variables (variabel, gradien [, grad_reqs]) Metode ini akan menandai NDArray sebagai variabel untuk menghitung gradien untuk autograd. Metode ini sama dengan fungsi .attach_grad () dalam variabel tetapi satu-satunya perbedaan adalah bahwa dengan panggilan ini kita dapat menyetel gradien ke nilai apa pun.
jeda ([train_mode]) Metode ini mengembalikan konteks cakupan untuk digunakan dalam pernyataan 'dengan' untuk kode yang tidak memerlukan penghitungan gradien.
predict_mode () Metode ini mengembalikan konteks cakupan untuk digunakan dalam pernyataan 'with' di mana perilaku forward pass diatur ke mode inferensi dan tanpa mengubah status perekaman.
rekor ([train_mode]) Ini akan mengembalikan autograd merekam konteks lingkup untuk digunakan dalam pernyataan 'dengan' dan menangkap kode yang memerlukan penghitungan gradien.
set_recording (is_recording) Mirip dengan is_recoring (), dengan bantuan metode ini kita bisa mendapatkan status merekam dan bukan merekam.
set_training (is_training) Mirip dengan is_traininig (), dengan bantuan metode ini kita dapat menyetel status ke pelatihan atau prediksi.
train_mode () Metode ini akan mengembalikan konteks cakupan untuk digunakan dalam pernyataan 'with' di mana perilaku forward pass diatur ke mode pelatihan dan tanpa mengubah status perekaman.

Contoh Implementasi

Pada contoh di bawah ini, kita akan menggunakan metode mxnet.autograd.grad () untuk menghitung gradien head sehubungan dengan variabel -

x = mx.nd.ones((2,))
x.attach_grad()
with mx.autograd.record():
z = mx.nd.elemwise_add(mx.nd.exp(x), x)
dx_grad = mx.autograd.grad(z, [x], create_graph=True)
dx_grad

Output

Outputnya disebutkan di bawah ini -

[
[3.7182817 3.7182817]
<NDArray 2 @cpu(0)>]

Kita bisa menggunakan metode mxnet.autograd.predict_mode () untuk mengembalikan ruang lingkup yang akan digunakan dalam pernyataan 'with' -

with mx.autograd.record():
y = model(x)
with mx.autograd.predict_mode():
y = sampling(y)
backward([y])

mxnet.intializer

Ini adalah MXNet 'API untuk penginisialisasi timbangan. Ini memiliki kelas-kelas berikut -

Kelas dan parameternya

Berikut adalah metode dan parameternya mxnet.autogard.function kelas:

Kelas dan Parameternya Definisi
Bilinear () Dengan bantuan kelas ini kita dapat menginisialisasi bobot untuk lapisan pengambilan sampel.
Nilai konstan) Kelas ini menginisialisasi bobot ke nilai tertentu. Nilainya dapat berupa skalar serta NDArray yang cocok dengan bentuk parameter yang akan disetel.
FusedRNN (init, num_hidden, num_layers, mode) Seperti namanya, kelas ini menginisialisasi parameter untuk lapisan Recurrent Neural Network (RNN) yang menyatu.
InitDesc Ini bertindak sebagai pendeskripsi untuk pola inisialisasi.
Penginisialisasi (** kwargs) Ini adalah kelas dasar penginisialisasi.
LSTMBias ([forget_bias]) Kelas ini menginisialisasi semua bias LSTMCell ke 0,0 tetapi kecuali untuk gerbang lupa yang biasnya disetel ke nilai khusus.
Muat (param [, default_init, verbose]) Kelas ini menginisialisasi variabel dengan memuat data dari file atau kamus.
MSRAPrelu ([factor_type, slope]) Sesuai namanya, kelas ini menginisialisasi pemberat menurut kertas MSRA.
Campuran (pola, penginisialisasi) Ini menginisialisasi parameter menggunakan beberapa penginisialisasi.
Normal ([sigma]) Kelas normal () menginisialisasi bobot dengan nilai acak yang diambil sampelnya dari distribusi normal dengan mean nol dan deviasi standar (SD) sigma.
Satu() Ini menginisialisasi bobot parameter menjadi satu.
Ortogonal ([skala, rand_type]) Sesuai namanya, kelas ini menginisialisasi bobot sebagai matriks ortogonal.
Seragam ([skala]) Ini menginisialisasi bobot dengan nilai acak yang diambil sampelnya secara seragam dari rentang tertentu.
Xavier ([rnd_type, factor_type, magnitude]) Ini sebenarnya mengembalikan penginisialisasi yang melakukan inisialisasi "Xavier" untuk bobot.
Nol() Ini menginisialisasi bobot parameter ke nol.

Contoh Implementasi

Pada contoh di bawah ini, kita akan menggunakan kelas mxnet.init.Normal () membuat penginisialisasi dan mengambil parameternya -

init = mx.init.Normal(0.8)
init.dumps()

Output

Outputnya diberikan di bawah ini -

'["normal", {"sigma": 0.8}]'

Example

init = mx.init.Xavier(factor_type="in", magnitude=2.45)
init.dumps()

Output

Outputnya ditunjukkan di bawah ini -

'["xavier", {"rnd_type": "uniform", "factor_type": "in", "magnitude": 2.45}]'

Pada contoh di bawah ini, kita akan menggunakan kelas mxnet.initializer.Mixed () untuk menginisialisasi parameter menggunakan beberapa penginisialisasi -

init = mx.initializer.Mixed(['bias', '.*'], [mx.init.Zero(),
mx.init.Uniform(0.1)])
module.init_params(init)

for dictionary in module.get_params():
for key in dictionary:
print(key)
print(dictionary[key].asnumpy())

Output

Outputnya ditunjukkan di bawah ini -

fullyconnected1_weight
[[ 0.0097627 0.01856892 0.04303787]]
fullyconnected1_bias
[ 0.]