Apache MXNet - Pendahuluan

Bab ini menyoroti fitur-fitur Apache MXNet dan berbicara tentang versi terbaru dari kerangka kerja perangkat lunak pembelajaran mendalam ini.

Apa itu MXNet?

Apache MXNet adalah instrumen kerangka kerja perangkat lunak pembelajaran mendalam sumber terbuka yang kuat yang membantu pengembang membangun, melatih, dan menerapkan model Pembelajaran Mendalam. Beberapa tahun terakhir, dari perawatan kesehatan hingga transportasi hingga manufaktur dan, pada kenyataannya, dalam setiap aspek kehidupan kita sehari-hari, dampak pembelajaran mendalam telah tersebar luas. Saat ini, pembelajaran mendalam dicari oleh perusahaan untuk memecahkan beberapa masalah sulit seperti Pengenalan wajah, deteksi objek, Pengenalan Karakter Optik (OCR), Pengenalan Ucapan, dan Terjemahan Mesin.

Itulah alasan Apache MXNet didukung oleh:

  • Beberapa perusahaan besar seperti Intel, Baidu, Microsoft, Wolfram Research, dll.

  • Penyedia cloud publik termasuk Amazon Web Services (AWS), dan Microsoft Azure

  • Beberapa lembaga penelitian besar seperti Carnegie Mellon, MIT, Universitas Washington, dan Universitas Sains & Teknologi Hong Kong.

Mengapa Apache MXNet?

Ada berbagai platform pembelajaran mendalam seperti Torch7, Caffe, Theano, TensorFlow, Keras, Microsoft Cognitive Toolkit, dll. Ada maka Anda mungkin bertanya-tanya mengapa Apache MXNet? Mari kita lihat beberapa alasan di baliknya:

  • Apache MXNet memecahkan salah satu masalah terbesar dari platform pembelajaran mendalam yang ada. Masalahnya adalah untuk menggunakan platform pembelajaran yang dalam, seseorang harus mempelajari sistem lain untuk citarasa pemrograman yang berbeda.

  • Dengan bantuan pengembang Apache MXNet dapat memanfaatkan kemampuan penuh GPU serta komputasi awan.

  • Apache MXNet dapat mempercepat komputasi numerik apa pun dan memberikan penekanan khusus pada percepatan pengembangan dan penerapan DNN skala besar (jaringan neural dalam).

  • Ini memberikan pengguna kemampuan pemrograman imperatif dan simbolik.

Berbagai Fitur

Jika Anda mencari library deep learning yang fleksibel untuk mengembangkan penelitian deep learning mutakhir dengan cepat atau platform yang kuat untuk mendorong beban kerja produksi, pencarian Anda berakhir di Apache MXNet. Itu karena fitur-fiturnya berikut ini:

Pelatihan Terdistribusi

Baik itu pelatihan multi-gpu atau multi-host dengan efisiensi penskalaan yang hampir linier, Apache MXNet memungkinkan pengembang untuk memaksimalkan perangkat keras mereka. MXNet juga mendukung integrasi dengan Horovod, yang merupakan kerangka pembelajaran terdistribusi sumber terbuka yang dibuat di Uber.

Untuk integrasi ini, berikut adalah beberapa API terdistribusi umum yang ditentukan di Horovod:

  • horovod.broadcast()

  • horovod.allgather()

  • horovod.allgather()

Dalam hal ini, MXNet menawarkan kepada kami kemampuan berikut:

  • Device Placement - Dengan bantuan MXNet kita dapat dengan mudah menentukan setiap struktur data (DS).

  • Automatic Differentiation - Apache MXNet mengotomatiskan diferensiasi, yaitu kalkulasi turunan.

  • Multi-GPU training - MXNet memungkinkan kami mencapai efisiensi penskalaan dengan sejumlah GPU yang tersedia.

  • Optimized Predefined Layers - Kita dapat mengkodekan lapisan kita sendiri di MXNet serta mengoptimalkan lapisan yang telah ditentukan sebelumnya untuk kecepatan juga.

Hibridisasi

Apache MXNet memberi penggunanya front-end hybrid. Dengan bantuan Gluon Python API, ia dapat menjembatani kesenjangan antara kemampuan imperatif dan simbolisnya. Itu dapat dilakukan dengan menyebutnya fungsi hibridisasi.

Komputasi Lebih Cepat

Operasi linier seperti puluhan atau ratusan perkalian matriks adalah penghambat komputasi untuk jaringan saraf dalam. Untuk mengatasi kemacetan ini MXNet menyediakan -

  • Perhitungan numerik yang dioptimalkan untuk GPU

  • Perhitungan numerik yang dioptimalkan untuk ekosistem terdistribusi

  • Otomatisasi alur kerja umum dengan bantuan NN standar yang dapat diekspresikan secara singkat.

Binding Bahasa

MXNet memiliki integrasi yang dalam ke bahasa tingkat tinggi seperti Python dan R. Ini juga menyediakan dukungan untuk bahasa pemrograman lain seperti-

  • Scala

  • Julia

  • Clojure

  • Java

  • C/C++

  • Perl

Kami tidak perlu mempelajari bahasa pemrograman baru, melainkan MXNet, yang dikombinasikan dengan fitur hibridisasi, memungkinkan transisi yang sangat mulus dari Python ke penerapan dalam bahasa pemrograman pilihan kami.

Versi MXNet 1.6.0

Apache Software Foundation (ASF) telah merilis Apache MXNet versi 1.6.0 yang stabil pada 21 Februari 2020 di bawah Lisensi Apache 2.0. Ini adalah rilis MXNet terakhir yang mendukung Python 2 karena komunitas MXNet memilih untuk tidak lagi mendukung Python 2 di rilis selanjutnya. Mari kita lihat beberapa fitur baru yang dibawa rilis ini untuk penggunanya.

Antarmuka yang Kompatibel dengan NumPy

Karena fleksibilitas dan keumumannya, NumPy telah banyak digunakan oleh praktisi, ilmuwan, dan pelajar Machine Learning. Namun seperti yang kita ketahui bahwa, akselerator perangkat keras saat ini seperti Graphical Processing Units (GPU) telah semakin berasimilasi dengan berbagai toolkit Machine Learning (ML), pengguna NumPy, untuk memanfaatkan kecepatan GPU, perlu beralih ke framework baru dengan sintaks yang berbeda.

Dengan MXNet 1.6.0, Apache MXNet bergerak menuju pengalaman pemrograman yang kompatibel dengan NumPy. Antarmuka baru memberikan kegunaan yang setara serta ekspresif bagi praktisi yang akrab dengan sintaks NumPy. Bersamaan dengan itu MXNet 1.6.0 juga memungkinkan sistem Numpy yang ada untuk memanfaatkan akselerator perangkat keras seperti GPU untuk mempercepat komputasi skala besar.

Integrasi dengan Apache TVM

Apache TVM, tumpukan kompiler pembelajaran mendalam end-to-end open-source untuk backend perangkat keras seperti CPU, GPU, dan akselerator khusus, bertujuan untuk mengisi celah antara kerangka kerja pembelajaran mendalam yang berfokus pada produktivitas dan backend perangkat keras yang berorientasi pada kinerja . Dengan rilis terbaru MXNet 1.6.0, pengguna dapat memanfaatkan Apache (inkubasi) TVM untuk mengimplementasikan kernel operator berperforma tinggi dalam bahasa pemrograman Python. Dua keuntungan utama dari fitur baru ini adalah sebagai berikut -

  • Menyederhanakan proses pengembangan berbasis C ++ sebelumnya.

  • Memungkinkan berbagi implementasi yang sama di beberapa backend perangkat keras seperti CPU, GPU, dll.

Perbaikan fitur yang ada

Terlepas dari fitur MXNet 1.6.0 yang terdaftar di atas, ini juga memberikan beberapa peningkatan atas fitur yang ada. Perbaikannya adalah sebagai berikut -

Pengelompokan operasi berdasarkan elemen untuk GPU

Seperti yang kita ketahui kinerja operasi elemen-bijaksana adalah memori-bandwidth dan itulah alasannya, merangkai operasi semacam itu dapat mengurangi kinerja secara keseluruhan. Apache MXNet 1.6.0 melakukan fusi operasi berdasarkan elemen, yang sebenarnya menghasilkan operasi gabungan just-in-time jika memungkinkan. Fusi operasi yang bijak dengan elemen tersebut juga mengurangi kebutuhan penyimpanan dan meningkatkan kinerja secara keseluruhan.

Menyederhanakan ekspresi umum

MXNet 1.6.0 menghilangkan ekspresi redundan dan menyederhanakan ekspresi umum. Peningkatan tersebut juga meningkatkan penggunaan memori dan waktu eksekusi total.

Optimasi

MXNet 1.6.0 juga memberikan berbagai optimasi pada fitur & operator yang ada, yaitu sebagai berikut:

  • Presisi Campuran Otomatis

  • API Gluon Fit

  • MKL-DNN

  • Dukungan tensor besar

  • TensorRT integrasi

  • Dukungan gradien tingkat tinggi

  • Operators

  • Profiler kinerja operator

  • Impor / ekspor ONNX

  • Peningkatan pada Gluon API

  • Perbaikan pada Symbol API

  • Lebih dari 100 perbaikan bug