Apache MXNet - Pendahuluan
Bab ini menyoroti fitur-fitur Apache MXNet dan berbicara tentang versi terbaru dari kerangka kerja perangkat lunak pembelajaran mendalam ini.
Apa itu MXNet?
Apache MXNet adalah instrumen kerangka kerja perangkat lunak pembelajaran mendalam sumber terbuka yang kuat yang membantu pengembang membangun, melatih, dan menerapkan model Pembelajaran Mendalam. Beberapa tahun terakhir, dari perawatan kesehatan hingga transportasi hingga manufaktur dan, pada kenyataannya, dalam setiap aspek kehidupan kita sehari-hari, dampak pembelajaran mendalam telah tersebar luas. Saat ini, pembelajaran mendalam dicari oleh perusahaan untuk memecahkan beberapa masalah sulit seperti Pengenalan wajah, deteksi objek, Pengenalan Karakter Optik (OCR), Pengenalan Ucapan, dan Terjemahan Mesin.
Itulah alasan Apache MXNet didukung oleh:
Beberapa perusahaan besar seperti Intel, Baidu, Microsoft, Wolfram Research, dll.
Penyedia cloud publik termasuk Amazon Web Services (AWS), dan Microsoft Azure
Beberapa lembaga penelitian besar seperti Carnegie Mellon, MIT, Universitas Washington, dan Universitas Sains & Teknologi Hong Kong.
Mengapa Apache MXNet?
Ada berbagai platform pembelajaran mendalam seperti Torch7, Caffe, Theano, TensorFlow, Keras, Microsoft Cognitive Toolkit, dll. Ada maka Anda mungkin bertanya-tanya mengapa Apache MXNet? Mari kita lihat beberapa alasan di baliknya:
Apache MXNet memecahkan salah satu masalah terbesar dari platform pembelajaran mendalam yang ada. Masalahnya adalah untuk menggunakan platform pembelajaran yang dalam, seseorang harus mempelajari sistem lain untuk citarasa pemrograman yang berbeda.
Dengan bantuan pengembang Apache MXNet dapat memanfaatkan kemampuan penuh GPU serta komputasi awan.
Apache MXNet dapat mempercepat komputasi numerik apa pun dan memberikan penekanan khusus pada percepatan pengembangan dan penerapan DNN skala besar (jaringan neural dalam).
Ini memberikan pengguna kemampuan pemrograman imperatif dan simbolik.
Berbagai Fitur
Jika Anda mencari library deep learning yang fleksibel untuk mengembangkan penelitian deep learning mutakhir dengan cepat atau platform yang kuat untuk mendorong beban kerja produksi, pencarian Anda berakhir di Apache MXNet. Itu karena fitur-fiturnya berikut ini:
Pelatihan Terdistribusi
Baik itu pelatihan multi-gpu atau multi-host dengan efisiensi penskalaan yang hampir linier, Apache MXNet memungkinkan pengembang untuk memaksimalkan perangkat keras mereka. MXNet juga mendukung integrasi dengan Horovod, yang merupakan kerangka pembelajaran terdistribusi sumber terbuka yang dibuat di Uber.
Untuk integrasi ini, berikut adalah beberapa API terdistribusi umum yang ditentukan di Horovod:
horovod.broadcast()
horovod.allgather()
horovod.allgather()
Dalam hal ini, MXNet menawarkan kepada kami kemampuan berikut:
Device Placement - Dengan bantuan MXNet kita dapat dengan mudah menentukan setiap struktur data (DS).
Automatic Differentiation - Apache MXNet mengotomatiskan diferensiasi, yaitu kalkulasi turunan.
Multi-GPU training - MXNet memungkinkan kami mencapai efisiensi penskalaan dengan sejumlah GPU yang tersedia.
Optimized Predefined Layers - Kita dapat mengkodekan lapisan kita sendiri di MXNet serta mengoptimalkan lapisan yang telah ditentukan sebelumnya untuk kecepatan juga.
Hibridisasi
Apache MXNet memberi penggunanya front-end hybrid. Dengan bantuan Gluon Python API, ia dapat menjembatani kesenjangan antara kemampuan imperatif dan simbolisnya. Itu dapat dilakukan dengan menyebutnya fungsi hibridisasi.
Komputasi Lebih Cepat
Operasi linier seperti puluhan atau ratusan perkalian matriks adalah penghambat komputasi untuk jaringan saraf dalam. Untuk mengatasi kemacetan ini MXNet menyediakan -
Perhitungan numerik yang dioptimalkan untuk GPU
Perhitungan numerik yang dioptimalkan untuk ekosistem terdistribusi
Otomatisasi alur kerja umum dengan bantuan NN standar yang dapat diekspresikan secara singkat.
Binding Bahasa
MXNet memiliki integrasi yang dalam ke bahasa tingkat tinggi seperti Python dan R. Ini juga menyediakan dukungan untuk bahasa pemrograman lain seperti-
Scala
Julia
Clojure
Java
C/C++
Perl
Kami tidak perlu mempelajari bahasa pemrograman baru, melainkan MXNet, yang dikombinasikan dengan fitur hibridisasi, memungkinkan transisi yang sangat mulus dari Python ke penerapan dalam bahasa pemrograman pilihan kami.
Versi MXNet 1.6.0
Apache Software Foundation (ASF) telah merilis Apache MXNet versi 1.6.0 yang stabil pada 21 Februari 2020 di bawah Lisensi Apache 2.0. Ini adalah rilis MXNet terakhir yang mendukung Python 2 karena komunitas MXNet memilih untuk tidak lagi mendukung Python 2 di rilis selanjutnya. Mari kita lihat beberapa fitur baru yang dibawa rilis ini untuk penggunanya.
Antarmuka yang Kompatibel dengan NumPy
Karena fleksibilitas dan keumumannya, NumPy telah banyak digunakan oleh praktisi, ilmuwan, dan pelajar Machine Learning. Namun seperti yang kita ketahui bahwa, akselerator perangkat keras saat ini seperti Graphical Processing Units (GPU) telah semakin berasimilasi dengan berbagai toolkit Machine Learning (ML), pengguna NumPy, untuk memanfaatkan kecepatan GPU, perlu beralih ke framework baru dengan sintaks yang berbeda.
Dengan MXNet 1.6.0, Apache MXNet bergerak menuju pengalaman pemrograman yang kompatibel dengan NumPy. Antarmuka baru memberikan kegunaan yang setara serta ekspresif bagi praktisi yang akrab dengan sintaks NumPy. Bersamaan dengan itu MXNet 1.6.0 juga memungkinkan sistem Numpy yang ada untuk memanfaatkan akselerator perangkat keras seperti GPU untuk mempercepat komputasi skala besar.
Integrasi dengan Apache TVM
Apache TVM, tumpukan kompiler pembelajaran mendalam end-to-end open-source untuk backend perangkat keras seperti CPU, GPU, dan akselerator khusus, bertujuan untuk mengisi celah antara kerangka kerja pembelajaran mendalam yang berfokus pada produktivitas dan backend perangkat keras yang berorientasi pada kinerja . Dengan rilis terbaru MXNet 1.6.0, pengguna dapat memanfaatkan Apache (inkubasi) TVM untuk mengimplementasikan kernel operator berperforma tinggi dalam bahasa pemrograman Python. Dua keuntungan utama dari fitur baru ini adalah sebagai berikut -
Menyederhanakan proses pengembangan berbasis C ++ sebelumnya.
Memungkinkan berbagi implementasi yang sama di beberapa backend perangkat keras seperti CPU, GPU, dll.
Perbaikan fitur yang ada
Terlepas dari fitur MXNet 1.6.0 yang terdaftar di atas, ini juga memberikan beberapa peningkatan atas fitur yang ada. Perbaikannya adalah sebagai berikut -
Pengelompokan operasi berdasarkan elemen untuk GPU
Seperti yang kita ketahui kinerja operasi elemen-bijaksana adalah memori-bandwidth dan itulah alasannya, merangkai operasi semacam itu dapat mengurangi kinerja secara keseluruhan. Apache MXNet 1.6.0 melakukan fusi operasi berdasarkan elemen, yang sebenarnya menghasilkan operasi gabungan just-in-time jika memungkinkan. Fusi operasi yang bijak dengan elemen tersebut juga mengurangi kebutuhan penyimpanan dan meningkatkan kinerja secara keseluruhan.
Menyederhanakan ekspresi umum
MXNet 1.6.0 menghilangkan ekspresi redundan dan menyederhanakan ekspresi umum. Peningkatan tersebut juga meningkatkan penggunaan memori dan waktu eksekusi total.
Optimasi
MXNet 1.6.0 juga memberikan berbagai optimasi pada fitur & operator yang ada, yaitu sebagai berikut:
Presisi Campuran Otomatis
API Gluon Fit
MKL-DNN
Dukungan tensor besar
TensorRT integrasi
Dukungan gradien tingkat tinggi
Operators
Profiler kinerja operator
Impor / ekspor ONNX
Peningkatan pada Gluon API
Perbaikan pada Symbol API
Lebih dari 100 perbaikan bug