Caffe2 - Pendahuluan

Beberapa tahun terakhir, Pembelajaran Mendalam telah menjadi tren besar dalam Pembelajaran Mesin. Ini telah berhasil diterapkan untuk menyelesaikan masalah yang sebelumnya tidak terpecahkan di Vision, Speech Recognition and Natural Language Processing(NLP). Masih banyak lagi domain tempat Deep Learning diterapkan dan telah menunjukkan kegunaannya.

Caffe (Convolutional Architecture for Fast Feature Embedding) adalah kerangka pembelajaran mendalam yang dikembangkan di Berkeley Vision and Learning Center (BVLC). Proyek Caffe diciptakan oleh Yangqing Jia selama gelar Ph.D. di University of California - Berkeley. Caffe menyediakan cara mudah untuk bereksperimen dengan deep learning. Ini ditulis dalam C ++ dan menyediakan binding untukPython dan Matlab.

Ini mendukung berbagai jenis arsitektur pembelajaran mendalam seperti CNN (Jaringan Neural Konvolusional), LSTM(Memori Jangka Pendek Panjang) dan FC (Terhubung Penuh). Ini mendukung GPU dan karenanya, cocok untuk lingkungan produksi yang melibatkan jaringan neural dalam. Ini juga mendukung pustaka kernel berbasis CPU sepertiNVIDIA, Pustaka CUDA Deep Neural Network (cuDNN) dan Intel Math Kernel Library (Intel MKL).

Pada April 2017, perusahaan layanan jejaring sosial yang berbasis di AS Facebook mengumumkan Caffe2, yang sekarang menyertakan RNN (Recurrent Neural Networks) dan pada Maret 2018, Caffe2 digabungkan menjadi PyTorch. Pencipta Caffe2 dan anggota komunitas telah menciptakan model untuk memecahkan berbagai masalah. Model ini tersedia untuk umum sebagai model terlatih. Caffe2 membantu pembuat dalam menggunakan model ini dan membuat jaringan sendiri untuk membuat prediksi pada kumpulan data.

Sebelum kita membahas detail Caffe2, mari kita pahami perbedaannya machine learning dan deep learning. Ini diperlukan untuk memahami bagaimana model dibuat dan digunakan di Caffe2.

Pembelajaran Mesin v / s Deep Learning

Dalam algoritme pembelajaran mesin apa pun, baik algoritme tradisional maupun pembelajaran mendalam, pemilihan fitur dalam kumpulan data memainkan peran yang sangat penting dalam mendapatkan akurasi prediksi yang diinginkan. Dalam teknik pembelajaran mesin tradisional, filefeature selectionsebagian besar dilakukan dengan inspeksi manusia, penilaian dan pengetahuan domain yang mendalam. Terkadang, Anda mungkin mencari bantuan dari beberapa algoritme yang diuji untuk pemilihan fitur.

Alur pembelajaran mesin tradisional digambarkan pada gambar di bawah -

Dalam pembelajaran mendalam, pemilihan fitur dilakukan secara otomatis dan merupakan bagian dari algoritma pembelajaran mendalam itu sendiri. Ini ditunjukkan pada gambar di bawah -

Dalam algoritma pembelajaran mendalam, feature engineeringdilakukan secara otomatis. Secara umum, rekayasa fitur memakan waktu dan membutuhkan keahlian yang baik dalam domain. Untuk menerapkan ekstraksi fitur otomatis, algoritme pembelajaran mendalam biasanya meminta sejumlah besar data, jadi jika Anda hanya memiliki ribuan dan puluhan ribu titik data, teknik pembelajaran mendalam mungkin gagal memberikan hasil yang memuaskan.

Dengan data yang lebih besar, algoritme pembelajaran mendalam menghasilkan hasil yang lebih baik dibandingkan dengan algoritme ML tradisional dengan keuntungan tambahan berupa sedikit atau tanpa rekayasa fitur.