Memecahkan Masalah Regresi dengan TensorFlow: Perjalanan Pembelajaran Mendalam
Pelajari cara membuat dan menyempurnakan Jaringan Neural Buatan menggunakan TensorFlow
Perkenalan
Analisis regresi dalam pembelajaran mesin adalah teknik yang digunakan untuk memprediksi nilai variabel dependen berdasarkan satu atau lebih variabel independen. Ini adalah teknik pembelajaran yang diawasi yang berada di bawah payung pemodelan prediktif.
Apakah Anda sedang mencari panduan pemula untuk mempelajari seluk beluk analisis regresi dan gatal untuk memahami konsep matematika yang rumit itu? Jangan takut, temanku! Saya telah menulis posting blog yang memecah konsep dengan cara yang sederhana dan mudah dipahami. Jadi, letakkan secangkir kopi itu, ambil kalkulator Anda, dan bersiaplah untuk terjun lebih dulu ke dunia analisis regresi yang aneh! Tidak sabar untuk melihat Anda di sana
Dasar-dasar Regresi Linear SederhanaDemikian pula, dalam pembelajaran mendalam, model regresi dapat dibangun menggunakan jaringan saraf, yaitu model komputasi yang meniru cara kerja otak manusia. Model-model ini terdiri dari beberapa lapisan neuron yang saling berhubungan alias perceptron dan bersama-sama dikenal sebagai MLP (Multi-Layer Perceptron) yang dapat belajar mengekstraksi fitur yang berguna dari data input dan membuat prediksi yang akurat.
Saya akan membagi posting blog singkat ini menjadi beberapa bagian berikut:
- Pra-pemrosesan Data.
- Model Arsitektur
- Pelatihan dan Evaluasi
- Kesimpulan.
Dalam ranah pembelajaran mesin, tahap prapemrosesan data memainkan peran penting dalam kesuksesan sebuah model. Tahap ini melibatkan persiapan input data untuk pelatihan dan pengujian model. Tahap ini mencakup beberapa langkah seperti pembersihan, eksplorasi, normalisasi, pemilihan fitur, penyandian, augmentasi, dll.
- Pembersihan data: Menghapus data yang tidak lengkap, tidak relevan, atau tidak akurat dari kumpulan data. Ini untuk memastikan bahwa data input berkualitas tinggi dan tidak mengandung outlier atau kesalahan yang dapat memengaruhi kinerja jaringan saraf.
- Eksplorasi data: Menganalisis kumpulan data untuk mendapatkan wawasan tentang distribusi dan hubungan antar fiturnya. Langkah ini membantu mengidentifikasi pola atau tren apa pun dalam data yang dapat digunakan untuk meningkatkan kinerja jaringan saraf.
- Normalisasi data: Menskalakan data sehingga semua fitur memiliki skala yang serupa. Ini adalah langkah penting karena memastikan bahwa jaringan saraf tidak memberi bobot berlebihan pada fitur yang memiliki nilai lebih besar.
- Pemilihan fitur: Memilih fitur terpenting yang akan digunakan untuk melatih jaringan saraf.
- Pengkodean data: Mengubah variabel kategori menjadi variabel numerik karena mesin hanya menerima data numerik sebagai input.
- Augmentasi data: Menghasilkan data pelatihan tambahan untuk meningkatkan keragaman dataset.
Di sini kita akan melewatkan proses eksplorasi dan pembersihan data untuk fokus pada tujuan utama kita. Sebagai gantinya, kami akan memuat set data dengan cepat dan menyiapkannya untuk model hanya dengan beberapa langkah sederhana. Meskipun eksplorasi dan pembersihan data adalah topik penting, mempelajarinya di sini akan membawa kita keluar jalur dari tujuan utama kita. Jadi, mari tetap fokus dan mulai ⚡⚡
Untuk pembuatan model regresi kami, kami akan mengambil Kumpulan Data Asuransi Kesehatan AS yang sering digunakan untuk memprediksi biaya medis berdasarkan karakteristik individu dan polis asuransi.
Kode memuat pustaka yang diperlukan termasuk pandas
, MinMaxScaler
make_column_transformer
dan OneHotEncoder
. Ini kemudian mengidentifikasi kolom numerik dan kategorikal dalam kumpulan data dan membuat transformator kolom ( ct
) untuk menerapkan MinMaxScaler ke fitur numerik dan OneHotEncoder ke fitur kategorikal.
Terakhir, trafo digunakan untuk mentransformasikan data train dan test, dan hasil transformasi data disimpan dalam x_train_transformed
dan x_test_transformed
. Kumpulan data yang diubah ini sekarang siap digunakan sebagai input untuk jaringan saraf, yang merupakan langkah selanjutnya dalam proses.
Model Arsitektur
Arsitektur model mengacu pada struktur jaringan saraf yang memetakan fitur input ke fitur output atau variabel target. Ini terdiri dari beberapa lapisan neuron yang melakukan operasi matematika pada data masukan.
Model arsitektur regresi tipikal akan memiliki parameter berikut:
- Lapisan masukan: Lapisan ini mengambil data masukan, yang bisa dalam bentuk tensor atau matriks.
- Lapisan tersembunyi: Ini adalah lapisan yang melakukan transformasi nonlinier dari data masukan. Jumlah lapisan tersembunyi dan jumlah neuron di setiap lapisan akan bergantung pada kompleksitas masalah dan jumlah data yang tersedia.
- Output layer: Lapisan ini menghasilkan prediksi akhir dari model. Dalam model regresi, lapisan output biasanya memiliki satu neuron yang menghasilkan nilai kontinu.
Di sini kita akan membuat jaringan saraf sederhana berdasarkan masalah kita. Kode berikut menetapkan benih acak, mendefinisikan arsitektur model dengan tiga lapisan, mengkompilasi model dengan fungsi kerugian kesalahan absolut rata-rata dan pengoptimal Adam, dan melatih model pada data pelatihan selama 100 zaman. Sejarah proses pelatihan disimpan dalam history
variabel, yang dapat digunakan untuk mengevaluasi kinerja model.
Menggunakan model.summary()
akan meringkas arsitektur model seperti ini
Bentuk input dan output sangat penting dalam arsitektur model jaringan saraf karena mereka menentukan bentuk matriks bobot dan bias yang akan dipelajari jaringan selama pelatihan.
Bentuk yang diatur dengan tidak tepat dapat menyebabkan kesalahan selama pelatihan dan prediksi, dan kesalahan bentuk adalah jenis kesalahan yang paling umum ditemui.
Ingin memperkuat keterampilan dasar Anda? Ini mungkin layak dibaca
Esensi Pembelajaran MendalamPelatihan & Evaluasi
Sekarang setelah kita menyiapkan arsitektur model, saatnya untuk melatih model dan membuat prediksi untuk mendapatkan wawasan. Mari berlatih
Selama pembuatan model, kami telah menetapkan metrik dan dapat dihitung menggunakan fungsi bawaan TensorFlow. Memastikan bentuk tensor yang benar sangatlah penting, terutama saat membandingkannya.
Tensor yang tidak cocok, terutama bentuk masukan dan keluaran, dapat menyebabkan banyak kesalahan. Meskipun tidak selalu diperlukan, penting untuk tetap waspada dan memeriksa ketidaksesuaian bentuk.
# Check the tensor shapes
y_test.shape, y_predicted.shape
>>> ((335,), (335, 1))
# Shape after squeeze()
y_predicted.squeeze().shape
>>> (335,)
# Calcuate the MAE
mae = tf.metrics.mean_absolute_error(y_true=y_test,
y_pred=y_predicted.squeeze())
# Calculate the MSE
mse = tf.metrics.mean_squared_error(y_true=y_test,
y_pred=y_predicted.squeeze())
mae, mse
>>> (<tf.Tensor: shape=(), dtype=float32, numpy=3687.7112>,
<tf.Tensor: shape=(), dtype=float32, numpy=50863628.0>)
Berikut kode lengkap untuk ini
Bersamaan dengan itu, ada beberapa metode untuk meningkatkan jaringan saraf, seperti menambah jumlah lapisan agar lebih dalam, menambah jumlah unit tersembunyi agar lebih luas, dan menyesuaikan kecepatan pembelajaran. Parameter ini, yang dapat disesuaikan oleh manusia, dikenal sebagai hyperparameter, dan proses menemukan hyperparameter yang paling sesuai dikenal sebagai penyetelan hyperparameter. Praktik ini banyak digunakan dalam pembelajaran mendalam untuk mengoptimalkan kinerja jaringan saraf.
Saya akan menyerahkan kepada Anda untuk bereksperimen dengan pendekatan yang berbeda dan mengembangkan pemahaman Anda sendiri.
Ke mana harus pergi dari sini?
Untuk mendapatkan pemahaman yang lebih komprehensif, saya akan merekomendasikan membuat kumpulan data khusus dan bereksperimen dengan hyperparameter. Salah satu pendekatannya adalah dengan membuat daftar angka dan menerapkan fungsi penghasil kustom ke dalamnya, memperkenalkan bias, dan menggunakan nilai yang dihasilkan sebagai variabel target. Kemudian, masukkan dataset ini ke jaringan neural dan sempurnakan untuk meningkatkan akurasi.
Saya telah membuat repositori komprehensif untuk TensorFlow yang terus saya perbarui secara berkala dengan eksperimen dan contoh. Jangan ragu untuk berkolaborasi di ruang ini
Kesimpulan
Membangun model regresi yang kuat menggunakan TensorFlow bukanlah tugas yang mudah, tetapi dengan alat dan teknik yang tepat, hal itu dapat dilakukan. Di blog ini, kami telah menjelajahi cara melakukan praproses data, menentukan arsitektur jaringan saraf yang dalam, melatih model, dan mengevaluasi kinerjanya. Dengan keterampilan ini, Anda akan dapat membuat model regresi untuk berbagai masalah dan kumpulan data. Ingat, latihan membuat sempurna, jadi teruslah bereksperimen dan sempurnakan model Anda sampai Anda mencapai tingkat akurasi dan performa yang diinginkan.
Dan ini membawa kita ke akhir posting blog ini . Selamat
Saya harap saya dapat menguraikan beberapa kata kunci seputar arsitektur model regresi menggunakan MLP (Multi-Layer Perceptron). Jika Anda memiliki pertanyaan atau saya melewatkan sesuatu di sini jangan ragu untuk mengirimkannya di bagian komentar.
Saya akan mencoba untuk memunculkan lebih banyak konsep Pembelajaran Mesin/Ilmu Data dan akan mencoba memecah istilah dan konsep yang terdengar mewah menjadi yang lebih sederhana.
Saya harap Anda menikmati artikel ini! Anda dapat mengikuti saya Afaque Umer untuk lebih banyak artikel serupa.