TensorFlow - Panduan Cepat
TensorFlow adalah library atau framework software, yang dirancang oleh tim Google untuk mengimplementasikan pembelajaran mesin dan konsep deep learning dengan cara yang paling mudah. Ini menggabungkan aljabar komputasi teknik pengoptimalan untuk memudahkan penghitungan banyak ekspresi matematika.
Situs resmi TensorFlow disebutkan di bawah ini -
www.tensorflow.org
Sekarang mari kita pertimbangkan fitur-fitur penting TensorFlow berikut -
Ini mencakup fitur yang mendefinisikan, mengoptimalkan, dan menghitung ekspresi matematika dengan mudah dengan bantuan array multi-dimensi yang disebut tensor.
Ini mencakup dukungan pemrograman jaringan saraf dalam dan teknik pembelajaran mesin.
Ini mencakup fitur komputasi skalabel tinggi dengan berbagai kumpulan data.
TensorFlow menggunakan komputasi GPU, mengotomatiskan pengelolaan. Ini juga mencakup fitur unik dari pengoptimalan memori yang sama dan data yang digunakan.
Mengapa TensorFlow Begitu Populer?
TensorFlow didokumentasikan dengan baik dan menyertakan banyak library machine learning. Ini menawarkan beberapa fungsi dan metode penting untuk hal yang sama.
TensorFlow juga disebut produk "Google". Ini mencakup berbagai algoritma pembelajaran mesin dan pembelajaran mendalam. TensorFlow dapat melatih dan menjalankan jaringan neural dalam untuk klasifikasi digit tulisan tangan, pengenalan gambar, penyematan kata, dan pembuatan berbagai model urutan.
Untuk menginstal TensorFlow, penting untuk menginstal "Python" di sistem Anda. Python versi 3.4+ dianggap yang terbaik untuk memulai dengan penginstalan TensorFlow.
Pertimbangkan langkah-langkah berikut untuk menginstal TensorFlow di sistem operasi Windows.
Step 1 - Verifikasi versi python yang diinstal.
Step 2- Pengguna dapat mengambil mekanisme apa pun untuk menginstal TensorFlow di sistem. Kami merekomendasikan "pip" dan "Anaconda". Pip adalah perintah yang digunakan untuk menjalankan dan menginstal modul dengan Python.
Sebelum menginstal TensorFlow, kita perlu menginstal framework Anaconda di sistem kita.
Setelah instalasi berhasil, periksa prompt perintah melalui perintah "conda". Eksekusi perintah ditampilkan di bawah -
Step 3 - Jalankan perintah berikut untuk menginisialisasi penginstalan TensorFlow -
conda create --name tensorflow python = 3.5
Itu mengunduh paket yang diperlukan untuk penyiapan TensorFlow.
Step 4 - Setelah penyiapan lingkungan berhasil, penting untuk mengaktifkan modul TensorFlow.
activate tensorflow
Step 5- Gunakan pip untuk menginstal "Tensorflow" di sistem. Perintah yang digunakan untuk instalasi disebutkan seperti di bawah ini -
pip install tensorflow
Dan,
pip install tensorflow-gpu
Setelah penginstalan berhasil, penting untuk mengetahui contoh eksekusi program TensorFlow.
Contoh berikut membantu kami memahami pembuatan program dasar "Hello World" di TensorFlow.
Kode untuk implementasi program pertama disebutkan di bawah ini -
>> activate tensorflow
>> python (activating python shell)
>> import tensorflow as tf
>> hello = tf.constant(‘Hello, Tensorflow!’)
>> sess = tf.Session()
>> print(sess.run(hello))
Artificial Intelligence mencakup proses simulasi kecerdasan manusia oleh mesin dan sistem komputer khusus. Contoh kecerdasan buatan meliputi pembelajaran, penalaran dan koreksi diri. Aplikasi AI mencakup pengenalan ucapan, sistem pakar, dan pengenalan gambar serta visi mesin.
Pembelajaran mesin adalah cabang dari kecerdasan buatan, yang berhubungan dengan sistem dan algoritma yang dapat mempelajari data dan pola data baru.
Mari kita fokus pada diagram Venn yang disebutkan di bawah ini untuk memahami konsep pembelajaran mesin dan pembelajaran mendalam.
Pembelajaran mesin mencakup bagian pembelajaran mesin dan pembelajaran mendalam adalah bagian dari pembelajaran mesin. Kemampuan program yang mengikuti konsep pembelajaran mesin adalah meningkatkan performansi data hasil observasi. Motif utama transformasi data adalah untuk meningkatkan pengetahuannya agar dapat mencapai hasil yang lebih baik di masa mendatang, memberikan keluaran yang lebih mendekati keluaran yang diinginkan untuk sistem tersebut. Pembelajaran mesin mencakup "pengenalan pola" yang mencakup kemampuan untuk mengenali pola dalam data.
Pola harus dilatih untuk menunjukkan keluaran dengan cara yang diinginkan.
Pembelajaran mesin dapat dilatih dengan dua cara berbeda -
- Pelatihan yang diawasi
- Pelatihan tanpa pengawasan
Pembelajaran yang Diawasi
Pembelajaran yang diawasi atau pelatihan yang diawasi mencakup prosedur di mana set pelatihan diberikan sebagai masukan ke sistem di mana, setiap contoh diberi label dengan nilai keluaran yang diinginkan. Pelatihan dalam jenis ini dilakukan dengan menggunakan minimisasi fungsi kerugian tertentu, yang merepresentasikan kesalahan keluaran sehubungan dengan sistem keluaran yang diinginkan.
Setelah menyelesaikan pelatihan, keakuratan setiap model diukur sehubungan dengan contoh terputus dari set pelatihan, juga disebut set validasi.
Contoh terbaik untuk mengilustrasikan "Pembelajaran yang diawasi" adalah dengan sekumpulan foto yang diberikan dengan informasi yang disertakan di dalamnya. Di sini, pengguna dapat melatih model untuk mengenali foto baru.
Pembelajaran Tanpa Pengawasan
Dalam pembelajaran tanpa pengawasan atau pelatihan tanpa pengawasan, sertakan contoh pelatihan, yang tidak diberi label oleh sistem kelas mereka. Sistem mencari data, yang memiliki kesamaan karakteristik, dan mengubahnya berdasarkan fitur pengetahuan internal. Jenis algoritma pembelajaran ini pada dasarnya digunakan dalam masalah pengelompokan.
Contoh terbaik untuk mengilustrasikan "Pembelajaran tanpa pengawasan" adalah dengan sekumpulan foto tanpa informasi yang disertakan dan pengguna melatih model dengan klasifikasi dan pengelompokan. Jenis algoritma pelatihan ini bekerja dengan asumsi karena tidak ada informasi yang diberikan.
Penting untuk memahami konsep matematika yang diperlukan untuk TensorFlow sebelum membuat aplikasi dasar di TensorFlow. Matematika dianggap sebagai inti dari semua algoritme pembelajaran mesin. Dengan bantuan konsep inti Matematika, solusi untuk algoritma pembelajaran mesin tertentu ditentukan.
Vektor
Larik angka, yang kontinu atau diskrit, didefinisikan sebagai vektor. Algoritme pembelajaran mesin menangani vektor panjang tetap untuk menghasilkan keluaran yang lebih baik.
Algoritme pembelajaran mesin menangani data multidimensi sehingga vektor memainkan peran penting.
Representasi bergambar model vektor adalah sebagai berikut -
Skalar
Skalar dapat didefinisikan sebagai vektor satu dimensi. Skalar adalah skalar, yang hanya mencakup besaran dan tidak ada arah. Dengan skalar, kami hanya mementingkan besarannya.
Contoh skalar termasuk parameter berat dan tinggi badan anak.
Matriks
Matriks dapat didefinisikan sebagai array multi-dimensi, yang disusun dalam format baris dan kolom. Besar kecilnya matriks ditentukan oleh panjang baris dan panjang kolom. Gambar berikut menunjukkan representasi dari matriks tertentu.
Perhatikan matriks dengan baris “m” dan kolom “n” seperti yang disebutkan di atas, representasi matriks akan ditentukan sebagai “matriks m * n” yang juga mendefinisikan panjang matriks.
Perhitungan Matematika
Pada bagian ini, kita akan mempelajari tentang Perhitungan Matematika yang berbeda di TensorFlow.
Penambahan matriks
Penambahan dua atau lebih matriks dimungkinkan jika matriks-matriks tersebut memiliki dimensi yang sama. Penambahan menyiratkan penambahan setiap elemen sesuai posisi yang diberikan.
Pertimbangkan contoh berikut untuk memahami cara kerja penambahan matriks -
$$Example:A=\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}B=\begin{bmatrix}5 & 6 \\7 & 8 \end{bmatrix}\:then\:A+B=\begin{bmatrix}1+5 & 2+6 \\3+7 & 4+8 \end{bmatrix}=\begin{bmatrix}6 & 8 \\10 & 12 \end{bmatrix}$$
Pengurangan matriks
Pengurangan matriks beroperasi dengan cara yang sama seperti penjumlahan dua matriks. Pengguna dapat mengurangi dua matriks asalkan dimensinya sama.
$$Example:A-\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}B-\begin{bmatrix}5 & 6 \\7 & 8 \end{bmatrix}\:then\:A-B-\begin{bmatrix}1-5 & 2-6 \\3-7 & 4-8 \end{bmatrix}-\begin{bmatrix}-4 & -4 \\-4 & -4 \end{bmatrix}$$
Perkalian matriks
Agar dua matriks A m * n dan B p * q dapat dikalikan, n harus sama dengan p. Matriks yang dihasilkan adalah -
C m * q
$$A=\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}B=\begin{bmatrix}5 & 6 \\7 & 8 \end{bmatrix}$$
$$c_{11}=\begin{bmatrix}1 & 2 \end{bmatrix}\begin{bmatrix}5 \\7 \end{bmatrix}=1\times5+2\times7=19\:c_{12}=\begin{bmatrix}1 & 2 \end{bmatrix}\begin{bmatrix}6 \\8 \end{bmatrix}=1\times6+2\times8=22$$
$$c_{21}=\begin{bmatrix}3 & 4 \end{bmatrix}\begin{bmatrix}5 \\7 \end{bmatrix}=3\times5+4\times7=43\:c_{22}=\begin{bmatrix}3 & 4 \end{bmatrix}\begin{bmatrix}6 \\8 \end{bmatrix}=3\times6+4\times8=50$$
$$C=\begin{bmatrix}c_{11} & c_{12} \\c_{21} & c_{22} \end{bmatrix}=\begin{bmatrix}19 & 22 \\43 & 50 \end{bmatrix}$$
Ubah urutan matriks
Transposisi matriks A, m * n umumnya diwakili oleh AT (transpos) n * m dan diperoleh dengan mentransposisi vektor kolom sebagai vektor baris.
$$Example:A=\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}\:then\:A^{T}\begin{bmatrix}1 & 3 \\2 & 4 \end{bmatrix}$$
Perkalian titik dari vektor
Setiap vektor berdimensi n dapat direpresentasikan sebagai matriks v = R ^ n * 1.
$$v_{1}=\begin{bmatrix}v_{11} \\v_{12} \\\cdot\\\cdot\\\cdot\\v_{1n}\end{bmatrix}v_{2}=\begin{bmatrix}v_{21} \\v_{22} \\\cdot\\\cdot\\\cdot\\v_{2n}\end{bmatrix}$$
Perkalian titik dari dua vektor adalah jumlah dari perkalian komponen yang bersesuaian - Komponen sepanjang dimensi yang sama dan dapat dinyatakan sebagai
$$v_{1}\cdot v_{2}=v_1^Tv_{2}=v_2^Tv_{1}=v_{11}v_{21}+v_{12}v_{22}+\cdot\cdot+v_{1n}v_{2n}=\displaystyle\sum\limits_{k=1}^n v_{1k}v_{2k}$$
Contoh perkalian titik dari vektor disebutkan di bawah ini -
$$Example:v_{1}=\begin{bmatrix}1 \\2 \\3\end{bmatrix}v_{2}=\begin{bmatrix}3 \\5 \\-1\end{bmatrix}v_{1}\cdot v_{2}=v_1^Tv_{2}=1\times3+2\times5-3\times1=10$$
Artificial Intelligence adalah salah satu tren paling populer akhir-akhir ini. Pembelajaran mesin dan pembelajaran mendalam merupakan kecerdasan buatan. Diagram Venn yang ditunjukkan di bawah ini menjelaskan hubungan pembelajaran mesin dan pembelajaran mendalam -
Pembelajaran mesin
Pembelajaran mesin adalah seni sains untuk membuat komputer bertindak sesuai dengan algoritme yang dirancang dan diprogram. Banyak peneliti berpikir bahwa pembelajaran mesin adalah cara terbaik untuk membuat kemajuan menuju AI tingkat manusia. Pembelajaran mesin mencakup jenis pola berikut
- Pola pembelajaran yang diawasi
- Pola belajar tanpa pengawasan
Pembelajaran Mendalam
Pembelajaran mendalam adalah sub-bidang pembelajaran mesin di mana algoritme terkait terinspirasi oleh struktur dan fungsi otak yang disebut jaringan saraf tiruan.
Semua nilai pembelajaran mendalam saat ini adalah melalui pembelajaran yang diawasi atau pembelajaran dari data dan algoritme berlabel.
Setiap algoritma dalam pembelajaran mendalam melewati proses yang sama. Ini mencakup hierarki transformasi input nonlinier yang dapat digunakan untuk menghasilkan model statistik sebagai output.
Pertimbangkan langkah-langkah berikut yang menentukan proses Machine Learning
- Mengidentifikasi kumpulan data yang relevan dan mempersiapkannya untuk analisis.
- Memilih jenis algoritma yang akan digunakan
- Membangun model analitik berdasarkan algoritma yang digunakan.
- Melatih model pada kumpulan data pengujian, merevisinya sesuai kebutuhan.
- Menjalankan model untuk menghasilkan skor tes.
Perbedaan antara Machine Learning dan Deep Learning
Di bagian ini, kita akan mempelajari perbedaan antara Machine Learning dan Deep Learning.
Jumlah data
Pembelajaran mesin berfungsi dengan data dalam jumlah besar. Ini juga berguna untuk sejumlah kecil data. Pembelajaran mendalam di sisi lain bekerja secara efisien jika jumlah data meningkat dengan cepat. Diagram berikut menunjukkan cara kerja machine learning dan deep learning dengan jumlah data -
Ketergantungan Hardware
Algoritme pembelajaran mendalam dirancang untuk sangat bergantung pada mesin kelas atas tidak seperti algoritme pembelajaran mesin tradisional. Algoritme pembelajaran mendalam melakukan sejumlah operasi perkalian matriks, yang membutuhkan dukungan perangkat keras dalam jumlah besar.
Rekayasa Fitur
Rekayasa fitur adalah proses menempatkan pengetahuan domain ke dalam fitur tertentu untuk mengurangi kompleksitas data dan membuat pola yang terlihat oleh algoritme pembelajaran yang berfungsi.
Contoh - Pola pembelajaran mesin tradisional berfokus pada piksel dan atribut lain yang diperlukan untuk proses rekayasa fitur. Algoritme pembelajaran mendalam berfokus pada fitur tingkat tinggi dari data. Ini mengurangi tugas mengembangkan ekstraktor fitur baru dari setiap masalah baru.
Pendekatan Pemecahan Masalah
Algoritme pembelajaran mesin tradisional mengikuti prosedur standar untuk menyelesaikan masalah. Ini memecah masalah menjadi beberapa bagian, menyelesaikan masing-masing dan menggabungkannya untuk mendapatkan hasil yang diinginkan. Pembelajaran mendalam berfokus pada pemecahan masalah dari ujung ke ujung, bukan memecahnya menjadi beberapa divisi.
Waktu eksekusi
Waktu eksekusi adalah jumlah waktu yang dibutuhkan untuk melatih algoritme. Pembelajaran mendalam membutuhkan banyak waktu untuk dilatih karena mencakup banyak parameter yang membutuhkan waktu lebih lama dari biasanya. Algoritme pembelajaran mesin secara komparatif membutuhkan lebih sedikit waktu eksekusi.
Interpretabilitas
Interpretabilitas adalah faktor utama untuk perbandingan pembelajaran mesin dan algoritma pembelajaran mendalam. Alasan utamanya adalah bahwa pembelajaran yang dalam masih diberikan pertimbangan ulang sebelum digunakan dalam industri.
Aplikasi Machine Learning dan Deep Learning
Di bagian ini, kita akan mempelajari tentang berbagai aplikasi Machine Learning dan Deep Learning.
Computer vision yang digunakan untuk pengenalan wajah dan tanda kehadiran melalui sidik jari atau identifikasi kendaraan melalui plat nomor.
Pengambilan Informasi dari mesin pencari seperti pencarian teks untuk pencarian gambar.
Pemasaran email otomatis dengan identifikasi target yang ditentukan.
Diagnosis medis tumor kanker atau identifikasi anomali penyakit kronis.
Pemrosesan bahasa alami untuk aplikasi seperti penandaan foto. Contoh terbaik untuk menjelaskan skenario ini digunakan di Facebook.
Iklan online.
Tren masa depan
Dengan meningkatnya tren penggunaan ilmu data dan pembelajaran mesin di industri, akan menjadi penting bagi setiap organisasi untuk menanamkan pembelajaran mesin dalam bisnis mereka.
Pembelajaran mendalam menjadi lebih penting daripada pembelajaran mesin. Pembelajaran mendalam terbukti menjadi salah satu teknik terbaik dalam pertunjukan mutakhir.
Pembelajaran mesin dan pembelajaran mendalam akan terbukti bermanfaat dalam bidang penelitian dan akademisi.
Kesimpulan
Dalam artikel ini, kami memiliki ikhtisar tentang pembelajaran mesin dan pembelajaran mendalam dengan ilustrasi dan perbedaan yang juga berfokus pada tren masa depan. Banyak aplikasi AI menggunakan algoritme pembelajaran mesin terutama untuk mendorong swalayan, meningkatkan produktivitas agen, dan alur kerja yang lebih andal. Pembelajaran mesin dan algoritme pembelajaran mendalam mencakup prospek yang menarik bagi banyak bisnis dan pemimpin industri.
Dalam bab ini, kita akan mempelajari dasar-dasar TensorFlow. Kita akan mulai dengan memahami struktur data tensor.
Struktur Data Tensor
Tensor digunakan sebagai struktur data dasar dalam bahasa TensorFlow. Tensor mewakili tepi penghubung dalam diagram alir apa pun yang disebut Grafik Aliran Data. Tensor didefinisikan sebagai array atau daftar multidimensi.
Tensor diidentifikasi oleh tiga parameter berikut -
Pangkat
Satuan dimensi yang dijelaskan dalam tensor disebut rank. Ini mengidentifikasi jumlah dimensi tensor. Pangkat tensor dapat digambarkan sebagai urutan atau dimensi-n dari suatu tensor yang ditentukan.
Bentuk
Jumlah baris dan kolom bersama-sama menentukan bentuk Tensor.
Tipe
Type mendeskripsikan tipe data yang ditetapkan ke elemen Tensor.
Seorang pengguna perlu mempertimbangkan aktivitas berikut untuk membuat Tensor -
- Buat larik berdimensi-n
- Ubah larik n-dimensi.
Berbagai Dimensi TensorFlow
TensorFlow mencakup berbagai dimensi. Dimensi dijelaskan secara singkat di bawah ini -
Tensor satu dimensi
Tensor satu dimensi adalah struktur larik normal yang mencakup sekumpulan nilai dari tipe data yang sama.
Declaration
>>> import numpy as np
>>> tensor_1d = np.array([1.3, 1, 4.0, 23.99])
>>> print tensor_1d
Implementasi dengan output ditunjukkan pada gambar di bawah -
Pengindeksan elemen sama dengan daftar Python. Elemen pertama dimulai dengan indeks 0; untuk mencetak nilai melalui indeks, yang perlu Anda lakukan hanyalah menyebutkan nomor indeks.
>>> print tensor_1d[0]
1.3
>>> print tensor_1d[2]
4.0
Tensor Dua Dimensi
Urutan array digunakan untuk membuat "tensor dua dimensi".
Pembuatan tensor dua dimensi dijelaskan di bawah ini -
Berikut ini adalah sintaks lengkap untuk membuat array dua dimensi -
>>> import numpy as np
>>> tensor_2d = np.array([(1,2,3,4),(4,5,6,7),(8,9,10,11),(12,13,14,15)])
>>> print(tensor_2d)
[[ 1 2 3 4]
[ 4 5 6 7]
[ 8 9 10 11]
[12 13 14 15]]
>>>
Elemen spesifik dari tensor dua dimensi dapat dilacak dengan bantuan nomor baris dan nomor kolom yang ditentukan sebagai nomor indeks.
>>> tensor_2d[3][2]
14
Penanganan dan Manipulasi Tensor
Pada bagian ini, kita akan belajar tentang Penanganan dan Manipulasi Tensor.
Untuk memulainya, mari kita pertimbangkan kode berikut -
import tensorflow as tf
import numpy as np
matrix1 = np.array([(2,2,2),(2,2,2),(2,2,2)],dtype = 'int32')
matrix2 = np.array([(1,1,1),(1,1,1),(1,1,1)],dtype = 'int32')
print (matrix1)
print (matrix2)
matrix1 = tf.constant(matrix1)
matrix2 = tf.constant(matrix2)
matrix_product = tf.matmul(matrix1, matrix2)
matrix_sum = tf.add(matrix1,matrix2)
matrix_3 = np.array([(2,7,2),(1,4,2),(9,0,2)],dtype = 'float32')
print (matrix_3)
matrix_det = tf.matrix_determinant(matrix_3)
with tf.Session() as sess:
result1 = sess.run(matrix_product)
result2 = sess.run(matrix_sum)
result3 = sess.run(matrix_det)
print (result1)
print (result2)
print (result3)
Output
Kode di atas akan menghasilkan output berikut -
Penjelasan
Kami telah membuat array multidimensi dalam kode sumber di atas. Sekarang, penting untuk dipahami bahwa kami membuat grafik dan sesi, yang mengelola Tensor dan menghasilkan keluaran yang sesuai. Dengan bantuan grafik, kami memiliki output yang menentukan perhitungan matematis antara Tensor.
Setelah memahami konsep pembelajaran mesin, sekarang kita dapat mengalihkan fokus kita ke konsep pembelajaran yang mendalam. Pembelajaran mendalam adalah divisi pembelajaran mesin dan dianggap sebagai langkah penting yang diambil oleh para peneliti dalam beberapa dekade terakhir. Contoh implementasi pembelajaran mendalam mencakup aplikasi seperti pengenalan gambar dan pengenalan suara.
Berikut adalah dua jenis jaringan neural dalam yang penting -
- Jaringan Neural Konvolusional
- Jaringan Neural Berulang
Dalam bab ini, kita akan fokus pada CNN, Jaringan Neural Konvolusional.
Jaringan Neural Konvolusional
Jaringan Neural Konvolusional dirancang untuk memproses data melalui beberapa lapisan array. Jenis jaringan saraf ini digunakan dalam aplikasi seperti pengenalan gambar atau pengenalan wajah. Perbedaan utama antara CNN dan jaringan saraf biasa lainnya adalah bahwa CNN mengambil masukan sebagai larik dua dimensi dan beroperasi secara langsung pada gambar daripada berfokus pada ekstraksi fitur yang menjadi fokus jaringan saraf lain.
Pendekatan dominan CNN mencakup solusi untuk masalah pengenalan. Perusahaan top seperti Google dan Facebook telah berinvestasi dalam penelitian dan pengembangan menuju proyek pengenalan untuk menyelesaikan aktivitas dengan kecepatan yang lebih tinggi.
Jaringan saraf konvolusional menggunakan tiga ide dasar -
- Bidang masing-masing lokal
- Convolution
- Pooling
Mari kita pahami ide ini secara detail.
CNN memanfaatkan korelasi spasial yang ada di dalam data masukan. Setiap lapisan jaringan saraf yang bersamaan menghubungkan beberapa neuron masukan. Wilayah khusus ini disebut bidang reseptif lokal. Bidang reseptif lokal berfokus pada neuron tersembunyi. Neuron tersembunyi memproses data masukan di dalam bidang yang disebutkan tanpa menyadari perubahan di luar batas tertentu.
Berikut adalah diagram representasi untuk menghasilkan bidang masing-masing lokal -
Jika kita mengamati representasi di atas, setiap koneksi mempelajari bobot neuron tersembunyi dengan koneksi terkait dengan pergerakan dari satu lapisan ke lapisan lainnya. Di sini, neuron individu melakukan pergeseran dari waktu ke waktu. Proses ini disebut "konvolusi".
Pemetaan koneksi dari lapisan masukan ke peta fitur tersembunyi didefinisikan sebagai "bobot bersama" dan bias yang disertakan disebut "bias bersama".
CNN atau jaringan neural konvolusional menggunakan lapisan penggabungan, yaitu lapisan, yang ditempatkan segera setelah deklarasi CNN. Ini mengambil masukan dari pengguna sebagai peta fitur yang keluar dari jaringan konvolusional dan menyiapkan peta fitur yang dipadatkan. Pooling layer membantu dalam membuat lapisan dengan neuron dari lapisan sebelumnya.
Implementasi TensorFlow dari CNN
Di bagian ini, kita akan mempelajari implementasi TensorFlow dari CNN. Langkah-langkahnya, yang membutuhkan eksekusi dan dimensi yang tepat dari seluruh jaringan, seperti yang ditunjukkan di bawah ini -
Step 1 - Sertakan modul yang diperlukan untuk TensorFlow dan modul kumpulan data, yang diperlukan untuk menghitung model CNN.
import tensorflow as tf
import numpy as np
from tensorflow.examples.tutorials.mnist import input_data
Step 2 - Deklarasikan fungsi yang dipanggil run_cnn(), yang mencakup berbagai parameter dan variabel pengoptimalan dengan deklarasi placeholder data. Variabel pengoptimalan ini akan mendeklarasikan pola pelatihan.
def run_cnn():
mnist = input_data.read_data_sets("MNIST_data/", one_hot = True)
learning_rate = 0.0001
epochs = 10
batch_size = 50
Step 3 - Pada langkah ini, kita akan mendeklarasikan placeholder data pelatihan dengan parameter input - untuk 28 x 28 piksel = 784. Ini adalah data gambar pipih yang diambil dari mnist.train.nextbatch().
Kami dapat membentuk kembali tensor sesuai dengan kebutuhan kami. Nilai pertama (-1) memberi tahu fungsi untuk secara dinamis membentuk dimensi itu berdasarkan jumlah data yang diteruskan ke sana. Kedua dimensi tengah disetel ke ukuran gambar (yaitu 28 x 28).
x = tf.placeholder(tf.float32, [None, 784])
x_shaped = tf.reshape(x, [-1, 28, 28, 1])
y = tf.placeholder(tf.float32, [None, 10])
Step 4 - Sekarang penting untuk membuat beberapa lapisan konvolusional -
layer1 = create_new_conv_layer(x_shaped, 1, 32, [5, 5], [2, 2], name = 'layer1')
layer2 = create_new_conv_layer(layer1, 32, 64, [5, 5], [2, 2], name = 'layer2')
Step 5- Mari kita ratakan output siap untuk tahap output yang terhubung sepenuhnya - setelah dua lapisan penyatuan langkah 2 dengan dimensi 28 x 28, ke dimensi 14 x 14 atau minimum 7 x 7 x, koordinat y, tetapi dengan 64 saluran keluaran. Untuk membuat sepenuhnya terhubung dengan lapisan "padat", bentuk baru harus [-1, 7 x 7 x 64]. Kita dapat mengatur beberapa bobot dan nilai bias untuk lapisan ini, kemudian mengaktifkannya dengan ULT.
flattened = tf.reshape(layer2, [-1, 7 * 7 * 64])
wd1 = tf.Variable(tf.truncated_normal([7 * 7 * 64, 1000], stddev = 0.03), name = 'wd1')
bd1 = tf.Variable(tf.truncated_normal([1000], stddev = 0.01), name = 'bd1')
dense_layer1 = tf.matmul(flattened, wd1) + bd1
dense_layer1 = tf.nn.relu(dense_layer1)
Step 6 - Lapisan lain dengan aktivasi softmax spesifik dengan pengoptimal yang diperlukan menentukan penilaian akurasi, yang membuat pengaturan operator inisialisasi.
wd2 = tf.Variable(tf.truncated_normal([1000, 10], stddev = 0.03), name = 'wd2')
bd2 = tf.Variable(tf.truncated_normal([10], stddev = 0.01), name = 'bd2')
dense_layer2 = tf.matmul(dense_layer1, wd2) + bd2
y_ = tf.nn.softmax(dense_layer2)
cross_entropy = tf.reduce_mean(
tf.nn.softmax_cross_entropy_with_logits(logits = dense_layer2, labels = y))
optimiser = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
init_op = tf.global_variables_initializer()
Step 7- Kita harus menyiapkan variabel pencatatan. Ini menambahkan ringkasan untuk menyimpan keakuratan data.
tf.summary.scalar('accuracy', accuracy)
merged = tf.summary.merge_all()
writer = tf.summary.FileWriter('E:\TensorFlowProject')
with tf.Session() as sess:
sess.run(init_op)
total_batch = int(len(mnist.train.labels) / batch_size)
for epoch in range(epochs):
avg_cost = 0
for i in range(total_batch):
batch_x, batch_y = mnist.train.next_batch(batch_size = batch_size)
_, c = sess.run([optimiser, cross_entropy], feed_dict = {
x:batch_x, y: batch_y})
avg_cost += c / total_batch
test_acc = sess.run(accuracy, feed_dict = {x: mnist.test.images, y:
mnist.test.labels})
summary = sess.run(merged, feed_dict = {x: mnist.test.images, y:
mnist.test.labels})
writer.add_summary(summary, epoch)
print("\nTraining complete!")
writer.add_graph(sess.graph)
print(sess.run(accuracy, feed_dict = {x: mnist.test.images, y:
mnist.test.labels}))
def create_new_conv_layer(
input_data, num_input_channels, num_filters,filter_shape, pool_shape, name):
conv_filt_shape = [
filter_shape[0], filter_shape[1], num_input_channels, num_filters]
weights = tf.Variable(
tf.truncated_normal(conv_filt_shape, stddev = 0.03), name = name+'_W')
bias = tf.Variable(tf.truncated_normal([num_filters]), name = name+'_b')
#Out layer defines the output
out_layer =
tf.nn.conv2d(input_data, weights, [1, 1, 1, 1], padding = 'SAME')
out_layer += bias
out_layer = tf.nn.relu(out_layer)
ksize = [1, pool_shape[0], pool_shape[1], 1]
strides = [1, 2, 2, 1]
out_layer = tf.nn.max_pool(
out_layer, ksize = ksize, strides = strides, padding = 'SAME')
return out_layer
if __name__ == "__main__":
run_cnn()
Berikut adalah keluaran yang dihasilkan oleh kode di atas -
See @{tf.nn.softmax_cross_entropy_with_logits_v2}.
2018-09-19 17:22:58.802268: I
T:\src\github\tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:140]
Your CPU supports instructions that this TensorFlow binary was not compiled to
use: AVX2
2018-09-19 17:25:41.522845: W
T:\src\github\tensorflow\tensorflow\core\framework\allocator.cc:101] Allocation
of 1003520000 exceeds 10% of system memory.
2018-09-19 17:25:44.630941: W
T:\src\github\tensorflow\tensorflow\core\framework\allocator.cc:101] Allocation
of 501760000 exceeds 10% of system memory.
Epoch: 1 cost = 0.676 test accuracy: 0.940
2018-09-19 17:26:51.987554: W
T:\src\github\tensorflow\tensorflow\core\framework\allocator.cc:101] Allocation
of 1003520000 exceeds 10% of system memory.
Jaringan saraf rekuren adalah jenis algoritme berorientasi pembelajaran mendalam, yang mengikuti pendekatan sekuensial. Dalam jaringan neural, kami selalu menganggap bahwa setiap input dan output tidak bergantung pada semua lapisan lainnya. Jenis jaringan saraf ini disebut berulang karena mereka melakukan perhitungan matematis secara berurutan.
Pertimbangkan langkah-langkah berikut untuk melatih jaringan saraf berulang -
Step 1 - Masukkan contoh spesifik dari dataset.
Step 2 - Jaringan akan mengambil contoh dan menghitung beberapa kalkulasi menggunakan variabel yang diinisialisasi secara acak.
Step 3 - Hasil prediksi kemudian dihitung.
Step 4 - Perbandingan hasil aktual yang dihasilkan dengan nilai yang diharapkan akan menghasilkan kesalahan.
Step 5 - Untuk melacak kesalahan, itu disebarkan melalui jalur yang sama di mana variabel juga disesuaikan.
Step 6 - Langkah-langkah dari 1 sampai 5 diulangi sampai kita yakin bahwa variabel yang dideklarasikan untuk mendapatkan keluaran didefinisikan dengan benar.
Step 7 - Prediksi sistematis dibuat dengan menerapkan variabel-variabel ini untuk mendapatkan masukan baru yang tidak terlihat.
Pendekatan skematis untuk merepresentasikan jaringan saraf berulang dijelaskan di bawah ini -
Implementasi Jaringan Neural Berulang dengan TensorFlow
Di bagian ini, kita akan mempelajari cara mengimplementasikan jaringan neural berulang dengan TensorFlow.
Step 1 - TensorFlow menyertakan berbagai pustaka untuk implementasi spesifik dari modul jaringan neural berulang.
#Import necessary modules
from __future__ import print_function
import tensorflow as tf
from tensorflow.contrib import rnn
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True)
Seperti disebutkan di atas, pustaka membantu dalam menentukan data masukan, yang merupakan bagian utama dari implementasi jaringan saraf berulang.
Step 2- Motif utama kami adalah mengklasifikasikan gambar menggunakan jaringan saraf berulang, di mana kami menganggap setiap baris gambar sebagai urutan piksel. Bentuk gambar MNIST secara khusus didefinisikan sebagai 28 * 28 px. Sekarang kita akan menangani 28 urutan dari 28 langkah untuk setiap sampel yang disebutkan. Kami akan menentukan parameter input untuk menyelesaikan pola sekuensial.
n_input = 28 # MNIST data input with img shape 28*28
n_steps = 28
n_hidden = 128
n_classes = 10
# tf Graph input
x = tf.placeholder("float", [None, n_steps, n_input])
y = tf.placeholder("float", [None, n_classes]
weights = {
'out': tf.Variable(tf.random_normal([n_hidden, n_classes]))
}
biases = {
'out': tf.Variable(tf.random_normal([n_classes]))
}
Step 3- Hitung hasil menggunakan fungsi yang ditentukan di RNN untuk mendapatkan hasil terbaik. Di sini, setiap bentuk data dibandingkan dengan bentuk masukan saat ini dan hasilnya dihitung untuk menjaga tingkat akurasi.
def RNN(x, weights, biases):
x = tf.unstack(x, n_steps, 1)
# Define a lstm cell with tensorflow
lstm_cell = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)
# Get lstm cell output
outputs, states = rnn.static_rnn(lstm_cell, x, dtype = tf.float32)
# Linear activation, using rnn inner loop last output
return tf.matmul(outputs[-1], weights['out']) + biases['out']
pred = RNN(x, weights, biases)
# Define loss and optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits = pred, labels = y))
optimizer = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cost)
# Evaluate model
correct_pred = tf.equal(tf.argmax(pred,1), tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
# Initializing the variables
init = tf.global_variables_initializer()
Step 4- Pada langkah ini, kami akan meluncurkan grafik untuk mendapatkan hasil komputasi. Ini juga membantu dalam menghitung keakuratan hasil tes.
with tf.Session() as sess:
sess.run(init)
step = 1
# Keep training until reach max iterations
while step * batch_size < training_iters:
batch_x, batch_y = mnist.train.next_batch(batch_size)
batch_x = batch_x.reshape((batch_size, n_steps, n_input))
sess.run(optimizer, feed_dict={x: batch_x, y: batch_y})
if step % display_step == 0:
# Calculate batch accuracy
acc = sess.run(accuracy, feed_dict={x: batch_x, y: batch_y})
# Calculate batch loss
loss = sess.run(cost, feed_dict={x: batch_x, y: batch_y})
print("Iter " + str(step*batch_size) + ", Minibatch Loss= " + \
"{:.6f}".format(loss) + ", Training Accuracy= " + \
"{:.5f}".format(acc))
step += 1
print("Optimization Finished!")
test_len = 128
test_data = mnist.test.images[:test_len].reshape((-1, n_steps, n_input))
test_label = mnist.test.labels[:test_len]
print("Testing Accuracy:", \
sess.run(accuracy, feed_dict={x: test_data, y: test_label}))
Tangkapan layar di bawah ini menunjukkan keluaran yang dihasilkan -
TensorFlow menyertakan alat visualisasi, yang disebut TensorBoard. Ini digunakan untuk menganalisis Grafik Aliran Data dan juga digunakan untuk memahami model pembelajaran mesin. Fitur penting TensorBoard mencakup tampilan berbagai jenis statistik tentang parameter dan detail grafik apa pun dalam penyelarasan vertikal.
Jaringan neural dalam mencakup hingga 36.000 node. TensorBoard membantu menciutkan node ini dalam blok level tinggi dan menyoroti struktur yang identik. Hal ini memungkinkan analisis grafik yang lebih baik yang berfokus pada bagian utama grafik komputasi. Visualisasi TensorBoard dikatakan sangat interaktif di mana pengguna dapat menggeser, memperbesar dan memperluas node untuk menampilkan detailnya.
Representasi diagram skematik berikut menunjukkan kerja lengkap visualisasi TensorBoard -
Algoritme menciutkan node menjadi blok tingkat tinggi dan menyorot grup tertentu dengan struktur identik, yang memisahkan node tingkat tinggi. TensorBoard yang dibuat berguna dan diperlakukan sama pentingnya untuk menyesuaikan model pembelajaran mesin. Alat visualisasi ini dirancang untuk file log konfigurasi dengan informasi ringkasan dan detail yang perlu ditampilkan.
Mari kita fokus pada contoh demo visualisasi TensorBoard dengan bantuan kode berikut -
import tensorflow as tf
# Constants creation for TensorBoard visualization
a = tf.constant(10,name = "a")
b = tf.constant(90,name = "b")
y = tf.Variable(a+b*2,name = 'y')
model = tf.initialize_all_variables() #Creation of model
with tf.Session() as session:
merged = tf.merge_all_summaries()
writer = tf.train.SummaryWriter("/tmp/tensorflowlogs",session.graph)
session.run(model)
print(session.run(y))
Tabel berikut menunjukkan berbagai simbol visualisasi TensorBoard yang digunakan untuk representasi node -
Penyematan kata adalah konsep pemetaan dari objek diskrit seperti kata ke vektor dan bilangan real. Ini penting sebagai masukan untuk pembelajaran mesin. Konsep tersebut mencakup fungsi standar, yang secara efektif mengubah objek masukan diskrit menjadi vektor yang berguna.
Ilustrasi contoh input embedding kata adalah sebagai berikut -
blue: (0.01359, 0.00075997, 0.24608, ..., -0.2524, 1.0048, 0.06259)
blues: (0.01396, 0.11887, -0.48963, ..., 0.033483, -0.10007, 0.1158)
orange: (-0.24776, -0.12359, 0.20986, ..., 0.079717, 0.23865, -0.014213)
oranges: (-0.35609, 0.21854, 0.080944, ..., -0.35413, 0.38511, -0.070976)
Word2vec.dll
Word2vec adalah pendekatan paling umum yang digunakan untuk teknik penyematan kata tanpa pengawasan. Ini melatih model sedemikian rupa sehingga kata input tertentu memprediksi konteks kata dengan menggunakan skip-gram.
TensorFlow memungkinkan banyak cara untuk mengimplementasikan model semacam ini dengan meningkatkan tingkat kecanggihan dan pengoptimalan, serta menggunakan konsep multithreading dan abstraksi tingkat yang lebih tinggi.
import os
import math
import numpy as np
import tensorflow as tf
from tensorflow.contrib.tensorboard.plugins import projector
batch_size = 64
embedding_dimension = 5
negative_samples = 8
LOG_DIR = "logs/word2vec_intro"
digit_to_word_map = {
1: "One",
2: "Two",
3: "Three",
4: "Four",
5: "Five",
6: "Six",
7: "Seven",
8: "Eight",
9: "Nine"}
sentences = []
# Create two kinds of sentences - sequences of odd and even digits.
for i in range(10000):
rand_odd_ints = np.random.choice(range(1, 10, 2), 3)
sentences.append(" ".join([digit_to_word_map[r] for r in rand_odd_ints]))
rand_even_ints = np.random.choice(range(2, 10, 2), 3)
sentences.append(" ".join([digit_to_word_map[r] for r in rand_even_ints]))
# Map words to indices
word2index_map = {}
index = 0
for sent in sentences:
for word in sent.lower().split():
if word not in word2index_map:
word2index_map[word] = index
index += 1
index2word_map = {index: word for word, index in word2index_map.items()}
vocabulary_size = len(index2word_map)
# Generate skip-gram pairs
skip_gram_pairs = []
for sent in sentences:
tokenized_sent = sent.lower().split()
for i in range(1, len(tokenized_sent)-1):
word_context_pair = [[word2index_map[tokenized_sent[i-1]],
word2index_map[tokenized_sent[i+1]]], word2index_map[tokenized_sent[i]]]
skip_gram_pairs.append([word_context_pair[1], word_context_pair[0][0]])
skip_gram_pairs.append([word_context_pair[1], word_context_pair[0][1]])
def get_skipgram_batch(batch_size):
instance_indices = list(range(len(skip_gram_pairs)))
np.random.shuffle(instance_indices)
batch = instance_indices[:batch_size]
x = [skip_gram_pairs[i][0] for i in batch]
y = [[skip_gram_pairs[i][1]] for i in batch]
return x, y
# batch example
x_batch, y_batch = get_skipgram_batch(8)
x_batch
y_batch
[index2word_map[word] for word in x_batch] [index2word_map[word[0]] for word in y_batch]
# Input data, labels train_inputs = tf.placeholder(tf.int32, shape = [batch_size])
train_labels = tf.placeholder(tf.int32, shape = [batch_size, 1])
# Embedding lookup table currently only implemented in CPU with
tf.name_scope("embeddings"):
embeddings = tf.Variable(
tf.random_uniform([vocabulary_size, embedding_dimension], -1.0, 1.0),
name = 'embedding')
# This is essentialy a lookup table
embed = tf.nn.embedding_lookup(embeddings, train_inputs)
# Create variables for the NCE loss
nce_weights = tf.Variable(
tf.truncated_normal([vocabulary_size, embedding_dimension], stddev = 1.0 /
math.sqrt(embedding_dimension)))
nce_biases = tf.Variable(tf.zeros([vocabulary_size]))
loss = tf.reduce_mean(
tf.nn.nce_loss(weights = nce_weights, biases = nce_biases, inputs = embed,
labels = train_labels,num_sampled = negative_samples,
num_classes = vocabulary_size)) tf.summary.scalar("NCE_loss", loss)
# Learning rate decay
global_step = tf.Variable(0, trainable = False)
learningRate = tf.train.exponential_decay(learning_rate = 0.1,
global_step = global_step, decay_steps = 1000, decay_rate = 0.95, staircase = True)
train_step = tf.train.GradientDescentOptimizer(learningRate).minimize(loss)
merged = tf.summary.merge_all()
with tf.Session() as sess:
train_writer = tf.summary.FileWriter(LOG_DIR,
graph = tf.get_default_graph())
saver = tf.train.Saver()
with open(os.path.join(LOG_DIR, 'metadata.tsv'), "w") as metadata:
metadata.write('Name\tClass\n') for k, v in index2word_map.items():
metadata.write('%s\t%d\n' % (v, k))
config = projector.ProjectorConfig()
embedding = config.embeddings.add() embedding.tensor_name = embeddings.name
# Link this tensor to its metadata file (e.g. labels).
embedding.metadata_path = os.path.join(LOG_DIR, 'metadata.tsv')
projector.visualize_embeddings(train_writer, config)
tf.global_variables_initializer().run()
for step in range(1000):
x_batch, y_batch = get_skipgram_batch(batch_size) summary, _ = sess.run(
[merged, train_step], feed_dict = {train_inputs: x_batch, train_labels: y_batch})
train_writer.add_summary(summary, step)
if step % 100 == 0:
saver.save(sess, os.path.join(LOG_DIR, "w2v_model.ckpt"), step)
loss_value = sess.run(loss, feed_dict = {
train_inputs: x_batch, train_labels: y_batch})
print("Loss at %d: %.5f" % (step, loss_value))
# Normalize embeddings before using
norm = tf.sqrt(tf.reduce_sum(tf.square(embeddings), 1, keep_dims = True))
normalized_embeddings = embeddings /
norm normalized_embeddings_matrix = sess.run(normalized_embeddings)
ref_word = normalized_embeddings_matrix[word2index_map["one"]]
cosine_dists = np.dot(normalized_embeddings_matrix, ref_word)
ff = np.argsort(cosine_dists)[::-1][1:10] for f in ff: print(index2word_map[f])
print(cosine_dists[f])
Keluaran
Kode di atas menghasilkan output berikut -
Untuk memahami perceptron lapisan tunggal, penting untuk memahami Jaringan Saraf Tiruan (JST). Jaringan saraf tiruan adalah sistem pemrosesan informasi yang mekanismenya diilhami oleh fungsionalitas sirkuit saraf biologis. Jaringan saraf tiruan memiliki banyak unit pemrosesan yang terhubung satu sama lain. Berikut adalah representasi skema jaringan saraf tiruan -
Diagram menunjukkan bahwa unit tersembunyi berkomunikasi dengan lapisan luar. Sedangkan unit input dan output hanya berkomunikasi melalui lapisan jaringan yang tersembunyi.
Pola koneksi dengan node, jumlah total layer dan level node antara input dan output dengan jumlah neuron per layer menentukan arsitektur jaringan saraf.
Ada dua jenis arsitektur. Jenis ini fokus pada fungsionalitas jaringan saraf tiruan sebagai berikut -
- Perceptron Lapisan Tunggal
- Perceptron Multi-Lapisan
Perceptron Lapisan Tunggal
Perceptron lapisan tunggal adalah model saraf yang diusulkan pertama kali dibuat. Isi memori lokal neuron terdiri dari vektor bobot. Perhitungan perceptron lapisan tunggal dilakukan atas perhitungan jumlah vektor input masing-masing dengan nilai dikalikan dengan elemen vektor bobot yang sesuai. Nilai yang ditampilkan di keluaran akan menjadi masukan dari fungsi aktivasi.
Mari kita fokus pada penerapan perceptron lapisan tunggal untuk masalah klasifikasi gambar menggunakan TensorFlow. Contoh terbaik untuk menggambarkan perceptron lapisan tunggal adalah melalui representasi "Regresi Logistik".
Sekarang, mari kita pertimbangkan langkah-langkah dasar berikut untuk melatih regresi logistik -
Bobot diinisialisasi dengan nilai acak di awal pelatihan.
Untuk setiap elemen set pelatihan, kesalahan dihitung dengan perbedaan antara keluaran yang diinginkan dan keluaran aktual. Kesalahan yang dihitung digunakan untuk mengatur bobot.
Proses ini diulangi hingga kesalahan yang dibuat pada seluruh set pelatihan tidak kurang dari ambang batas yang ditentukan, hingga jumlah iterasi maksimum tercapai.
Kode lengkap untuk evaluasi regresi logistik disebutkan di bawah ini -
# Import MINST data
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True)
import tensorflow as tf
import matplotlib.pyplot as plt
# Parameters
learning_rate = 0.01
training_epochs = 25
batch_size = 100
display_step = 1
# tf Graph Input
x = tf.placeholder("float", [None, 784]) # mnist data image of shape 28*28 = 784
y = tf.placeholder("float", [None, 10]) # 0-9 digits recognition => 10 classes
# Create model
# Set model weights
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
# Construct model
activation = tf.nn.softmax(tf.matmul(x, W) + b) # Softmax
# Minimize error using cross entropy
cross_entropy = y*tf.log(activation)
cost = tf.reduce_mean\ (-tf.reduce_sum\ (cross_entropy,reduction_indices = 1))
optimizer = tf.train.\ GradientDescentOptimizer(learning_rate).minimize(cost)
#Plot settings
avg_set = []
epoch_set = []
# Initializing the variables init = tf.initialize_all_variables()
# Launch the graph
with tf.Session() as sess:
sess.run(init)
# Training cycle
for epoch in range(training_epochs):
avg_cost = 0.
total_batch = int(mnist.train.num_examples/batch_size)
# Loop over all batches
for i in range(total_batch):
batch_xs, batch_ys = \ mnist.train.next_batch(batch_size)
# Fit training using batch data sess.run(optimizer, \ feed_dict = {
x: batch_xs, y: batch_ys})
# Compute average loss avg_cost += sess.run(cost, \ feed_dict = {
x: batch_xs, \ y: batch_ys})/total_batch
# Display logs per epoch step
if epoch % display_step == 0:
print ("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(avg_cost))
avg_set.append(avg_cost) epoch_set.append(epoch+1)
print ("Training phase finished")
plt.plot(epoch_set,avg_set, 'o', label = 'Logistic Regression Training phase')
plt.ylabel('cost')
plt.xlabel('epoch')
plt.legend()
plt.show()
# Test model
correct_prediction = tf.equal(tf.argmax(activation, 1), tf.argmax(y, 1))
# Calculate accuracy
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) print
("Model accuracy:", accuracy.eval({x: mnist.test.images, y: mnist.test.labels}))
Keluaran
Kode di atas menghasilkan output berikut -
Regresi logistik dianggap sebagai analisis prediktif. Regresi logistik digunakan untuk mendeskripsikan data dan menjelaskan hubungan antara satu variabel biner dependen dan satu atau lebih variabel nominal atau independen.
Dalam bab ini, kita akan fokus pada contoh dasar penerapan regresi linier menggunakan TensorFlow. Regresi logistik atau regresi linier adalah pendekatan pembelajaran mesin yang diawasi untuk klasifikasi kategori pesanan terpisah. Tujuan kita dalam bab ini adalah untuk membangun model yang dapat digunakan pengguna untuk memprediksi hubungan antara variabel prediktor dan satu atau lebih variabel independen.
Hubungan antara kedua variabel ini dianggap linier. Jika y adalah variabel dependen dan x dianggap sebagai variabel independen, maka hubungan regresi linier kedua variabel akan terlihat seperti persamaan berikut -
Y = Ax+b
Kami akan merancang algoritma untuk regresi linier. Ini akan memungkinkan kita untuk memahami dua konsep penting berikut -
- Fungsi Biaya
- Algoritme penurunan gradien
Representasi skematis dari regresi linier disebutkan di bawah ini -
Tampilan grafik dari persamaan regresi linier disebutkan di bawah ini -
Langkah-langkah merancang algoritma untuk regresi linier
Sekarang kita akan mempelajari tentang langkah-langkah yang membantu dalam merancang algoritma untuk regresi linier.
Langkah 1
Penting untuk mengimpor modul yang diperlukan untuk merencanakan modul regresi linier. Kami mulai mengimpor pustaka Python NumPy dan Matplotlib.
import numpy as np
import matplotlib.pyplot as plt
Langkah 2
Tentukan jumlah koefisien yang diperlukan untuk regresi logistik.
number_of_points = 500
x_point = []
y_point = []
a = 0.22
b = 0.78
LANGKAH 3
Iterasi variabel untuk menghasilkan 300 titik acak di sekitar persamaan regresi -
Y = 0,22x + 0,78
for i in range(number_of_points):
x = np.random.normal(0.0,0.5)
y = a*x + b +np.random.normal(0.0,0.1) x_point.append([x])
y_point.append([y])
LANGKAH 4
Lihat poin yang dihasilkan menggunakan Matplotlib.
fplt.plot(x_point,y_point, 'o', label = 'Input Data') plt.legend() plt.show()
Kode lengkap untuk regresi logistik adalah sebagai berikut -
import numpy as np
import matplotlib.pyplot as plt
number_of_points = 500
x_point = []
y_point = []
a = 0.22
b = 0.78
for i in range(number_of_points):
x = np.random.normal(0.0,0.5)
y = a*x + b +np.random.normal(0.0,0.1) x_point.append([x])
y_point.append([y])
plt.plot(x_point,y_point, 'o', label = 'Input Data') plt.legend()
plt.show()
Jumlah titik yang diambil sebagai masukan dianggap sebagai data masukan.
TFLearn dapat didefinisikan sebagai aspek deep learning modular dan transparan yang digunakan dalam framework TensorFlow. Motif utama TFLearn adalah menyediakan API tingkat yang lebih tinggi ke TensorFlow untuk memfasilitasi dan menampilkan eksperimen baru.
Pertimbangkan fitur-fitur penting TFLearn berikut -
TFLearn mudah digunakan dan dimengerti.
Ini mencakup konsep mudah untuk membangun lapisan jaringan yang sangat modular, pengoptimal, dan berbagai metrik yang disematkan di dalamnya.
Ini mencakup transparansi penuh dengan sistem kerja TensorFlow.
Ini mencakup fungsi helper yang kuat untuk melatih tensor bawaan yang menerima banyak input, output, dan pengoptimal.
Ini mencakup visualisasi grafik yang mudah dan indah.
Visualisasi grafik mencakup berbagai detail bobot, gradien, dan aktivasi.
Instal TFLearn dengan menjalankan perintah berikut -
pip install tflearn
Setelah menjalankan kode di atas, output berikut akan dihasilkan -
Ilustrasi berikut menunjukkan implementasi TFLearn dengan pengklasifikasi Random Forest -
from __future__ import division, print_function, absolute_import
#TFLearn module implementation
import tflearn
from tflearn.estimators import RandomForestClassifier
# Data loading and pre-processing with respect to dataset
import tflearn.datasets.mnist as mnist
X, Y, testX, testY = mnist.load_data(one_hot = False)
m = RandomForestClassifier(n_estimators = 100, max_nodes = 1000)
m.fit(X, Y, batch_size = 10000, display_step = 10)
print("Compute the accuracy on train data:")
print(m.evaluate(X, Y, tflearn.accuracy_op))
print("Compute the accuracy on test set:")
print(m.evaluate(testX, testY, tflearn.accuracy_op))
print("Digits for test images id 0 to 5:")
print(m.predict(testX[:5]))
print("True digits:")
print(testY[:5])
Pada bab ini, kita akan fokus pada perbedaan antara CNN dan RNN -
CNN | RNN |
---|---|
Sangat cocok untuk data spasial seperti gambar. | RNN cocok untuk data temporal, disebut juga data sekuensial. |
CNN dianggap lebih kuat dari RNN. | RNN menyertakan kompatibilitas fitur yang lebih sedikit jika dibandingkan dengan CNN. |
Jaringan ini menerima masukan ukuran tetap dan menghasilkan keluaran ukuran tetap. | RNN dapat menangani panjang input / output yang berubah-ubah. |
CNN adalah jenis jaringan saraf tiruan umpan maju dengan variasi perceptron multilayer yang dirancang untuk menggunakan praproses dalam jumlah minimal. | RNN tidak seperti feed forward neural network - dapat menggunakan memori internal mereka untuk memproses urutan input yang berubah-ubah. |
CNN menggunakan pola konektivitas antar neuron. Ini diilhami oleh organisasi korteks visual hewan, yang masing-masing neuronnya diatur sedemikian rupa sehingga mereka merespons wilayah yang tumpang tindih yang membentuk bidang visual. | Jaringan saraf berulang menggunakan informasi deret waktu - apa yang terakhir diucapkan pengguna akan memengaruhi ucapan selanjutnya. |
CNN ideal untuk pemrosesan gambar dan video. | RNN ideal untuk analisis teks dan ucapan. |
Ilustrasi berikut menunjukkan representasi skema CNN dan RNN -
Keras adalah library Python tingkat tinggi yang ringkas, mudah dipelajari, dan dijalankan di atas framework TensorFlow. Itu dibuat dengan fokus pada pemahaman teknik pembelajaran yang mendalam, seperti membuat lapisan untuk jaringan saraf yang mempertahankan konsep bentuk dan detail matematika. Pembuatan freamework dapat dari dua jenis berikut -
- API Sekuensial
- API Fungsional
Simak delapan langkah berikut untuk membuat model deep learning di Keras -
- Memuat data
- Memproses ulang data yang dimuat
- Definisi model
- Menyusun model
- Sesuaikan model yang ditentukan
- Evaluasi itu
- Buat prediksi yang diperlukan
- Simpan modelnya
Kami akan menggunakan Notebook Jupyter untuk eksekusi dan tampilan output seperti yang ditunjukkan di bawah ini -
Step 1 - Memuat data dan preprocessing data yang dimuat diimplementasikan terlebih dahulu untuk menjalankan model pembelajaran yang mendalam.
import warnings
warnings.filterwarnings('ignore')
import numpy as np
np.random.seed(123) # for reproducibility
from keras.models import Sequential
from keras.layers import Flatten, MaxPool2D, Conv2D, Dense, Reshape, Dropout
from keras.utils import np_utils
Using TensorFlow backend.
from keras.datasets import mnist
# Load pre-shuffled MNIST data into train and test sets
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = X_train.reshape(X_train.shape[0], 28, 28, 1)
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1)
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255
Y_train = np_utils.to_categorical(y_train, 10)
Y_test = np_utils.to_categorical(y_test, 10)
Langkah ini dapat didefinisikan sebagai "Impor perpustakaan dan Modul" yang berarti semua perpustakaan dan modul diimpor sebagai langkah awal.
Step 2 - Pada langkah ini, kita akan mendefinisikan arsitektur model -
model = Sequential()
model.add(Conv2D(32, 3, 3, activation = 'relu', input_shape = (28,28,1)))
model.add(Conv2D(32, 3, 3, activation = 'relu'))
model.add(MaxPool2D(pool_size = (2,2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation = 'relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation = 'softmax'))
Step 3 - Mari kita sekarang mengkompilasi model yang ditentukan -
model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])
Step 4 - Kami sekarang akan menyesuaikan model menggunakan data pelatihan -
model.fit(X_train, Y_train, batch_size = 32, epochs = 10, verbose = 1)
Output dari iterasi yang dibuat adalah sebagai berikut -
Epoch 1/10 60000/60000 [==============================] - 65s -
loss: 0.2124 -
acc: 0.9345
Epoch 2/10 60000/60000 [==============================] - 62s -
loss: 0.0893 -
acc: 0.9740
Epoch 3/10 60000/60000 [==============================] - 58s -
loss: 0.0665 -
acc: 0.9802
Epoch 4/10 60000/60000 [==============================] - 62s -
loss: 0.0571 -
acc: 0.9830
Epoch 5/10 60000/60000 [==============================] - 62s -
loss: 0.0474 -
acc: 0.9855
Epoch 6/10 60000/60000 [==============================] - 59s -
loss: 0.0416 -
acc: 0.9871
Epoch 7/10 60000/60000 [==============================] - 61s -
loss: 0.0380 -
acc: 0.9877
Epoch 8/10 60000/60000 [==============================] - 63s -
loss: 0.0333 -
acc: 0.9895
Epoch 9/10 60000/60000 [==============================] - 64s -
loss: 0.0325 -
acc: 0.9898
Epoch 10/10 60000/60000 [==============================] - 60s -
loss: 0.0284 -
acc: 0.9910
Bab ini akan berfokus pada cara memulai TensorFlow terdistribusi. Tujuannya adalah untuk membantu pengembang memahami konsep TF terdistribusi dasar yang berulang, seperti server TF. Kami akan menggunakan Notebook Jupyter untuk mengevaluasi TensorFlow terdistribusi. Implementasi komputasi terdistribusi dengan TensorFlow disebutkan di bawah -
Step 1 - Impor modul yang diperlukan wajib untuk komputasi terdistribusi -
import tensorflow as tf
Step 2- Buat cluster TensorFlow dengan satu node. Biarkan node ini bertanggung jawab atas pekerjaan yang memiliki nama "pekerja" dan yang akan mengoperasikan satu pengambilan di localhost: 2222.
cluster_spec = tf.train.ClusterSpec({'worker' : ['localhost:2222']})
server = tf.train.Server(cluster_spec)
server.target
Skrip di atas menghasilkan output berikut -
'grpc://localhost:2222'
The server is currently running.
Step 3 - Konfigurasi server dengan sesi masing-masing dapat dihitung dengan menjalankan perintah berikut -
server.server_def
Perintah di atas menghasilkan output berikut -
cluster {
job {
name: "worker"
tasks {
value: "localhost:2222"
}
}
}
job_name: "worker"
protocol: "grpc"
Step 4- Luncurkan sesi TensorFlow dengan mesin eksekusinya sebagai server. Gunakan TensorFlow untuk membuat dan menggunakan server lokallsof untuk mengetahui lokasi server.
sess = tf.Session(target = server.target)
server = tf.train.Server.create_local_server()
Step 5 - Lihat perangkat yang tersedia di sesi ini dan tutup sesi terkait.
devices = sess.list_devices()
for d in devices:
print(d.name)
sess.close()
Perintah di atas menghasilkan output berikut -
/job:worker/replica:0/task:0/device:CPU:0
Di sini, kami akan fokus pada pembentukan MetaGraph di TensorFlow. Ini akan membantu kami memahami modul ekspor di TensorFlow. MetaGraph berisi informasi dasar, yang diperlukan untuk melatih, melakukan evaluasi, atau menjalankan inferensi pada grafik yang dilatih sebelumnya.
Berikut adalah potongan kode yang sama -
def export_meta_graph(filename = None, collection_list = None, as_text = False):
"""this code writes `MetaGraphDef` to save_path/filename.
Arguments:
filename: Optional meta_graph filename including the path. collection_list:
List of string keys to collect. as_text: If `True`,
writes the meta_graph as an ASCII proto.
Returns:
A `MetaGraphDef` proto. """
Salah satu model penggunaan tipikal untuk hal yang sama disebutkan di bawah ini -
# Build the model ...
with tf.Session() as sess:
# Use the model ...
# Export the model to /tmp/my-model.meta.
meta_graph_def = tf.train.export_meta_graph(filename = '/tmp/my-model.meta')
Multi-Layer perceptron mendefinisikan arsitektur jaringan saraf tiruan yang paling rumit. Ini secara substansial terbentuk dari beberapa lapisan perceptron.
Representasi diagram dari pembelajaran multi-layer perceptron adalah seperti yang ditunjukkan di bawah ini -
Jaringan MLP biasanya digunakan untuk format pembelajaran yang diawasi. Algoritme pembelajaran tipikal untuk jaringan MLP juga disebut algoritme propagasi balik.
Sekarang, kita akan fokus pada implementasi dengan MLP untuk masalah klasifikasi gambar.
# Import MINST data
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True)
import tensorflow as tf
import matplotlib.pyplot as plt
# Parameters
learning_rate = 0.001
training_epochs = 20
batch_size = 100
display_step = 1
# Network Parameters
n_hidden_1 = 256
# 1st layer num features
n_hidden_2 = 256 # 2nd layer num features
n_input = 784 # MNIST data input (img shape: 28*28) n_classes = 10
# MNIST total classes (0-9 digits)
# tf Graph input
x = tf.placeholder("float", [None, n_input])
y = tf.placeholder("float", [None, n_classes])
# weights layer 1
h = tf.Variable(tf.random_normal([n_input, n_hidden_1])) # bias layer 1
bias_layer_1 = tf.Variable(tf.random_normal([n_hidden_1]))
# layer 1 layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(x, h), bias_layer_1))
# weights layer 2
w = tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2]))
# bias layer 2
bias_layer_2 = tf.Variable(tf.random_normal([n_hidden_2]))
# layer 2
layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, w), bias_layer_2))
# weights output layer
output = tf.Variable(tf.random_normal([n_hidden_2, n_classes]))
# biar output layer
bias_output = tf.Variable(tf.random_normal([n_classes])) # output layer
output_layer = tf.matmul(layer_2, output) + bias_output
# cost function
cost = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(
logits = output_layer, labels = y))
#cost = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(output_layer, y))
# optimizer
optimizer = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cost)
# optimizer = tf.train.GradientDescentOptimizer(
learning_rate = learning_rate).minimize(cost)
# Plot settings
avg_set = []
epoch_set = []
# Initializing the variables
init = tf.global_variables_initializer()
# Launch the graph
with tf.Session() as sess:
sess.run(init)
# Training cycle
for epoch in range(training_epochs):
avg_cost = 0.
total_batch = int(mnist.train.num_examples / batch_size)
# Loop over all batches
for i in range(total_batch):
batch_xs, batch_ys = mnist.train.next_batch(batch_size)
# Fit training using batch data sess.run(optimizer, feed_dict = {
x: batch_xs, y: batch_ys})
# Compute average loss
avg_cost += sess.run(cost, feed_dict = {x: batch_xs, y: batch_ys}) / total_batch
# Display logs per epoch step
if epoch % display_step == 0:
print
Epoch:", '%04d' % (epoch + 1), "cost=", "{:.9f}".format(avg_cost)
avg_set.append(avg_cost)
epoch_set.append(epoch + 1)
print
"Training phase finished"
plt.plot(epoch_set, avg_set, 'o', label = 'MLP Training phase')
plt.ylabel('cost')
plt.xlabel('epoch')
plt.legend()
plt.show()
# Test model
correct_prediction = tf.equal(tf.argmax(output_layer, 1), tf.argmax(y, 1))
# Calculate accuracy
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
print
"Model Accuracy:", accuracy.eval({x: mnist.test.images, y: mnist.test.labels})
Baris kode di atas menghasilkan output berikut -
Dalam bab ini, kita akan fokus pada jaringan yang harus kita pelajari dari kumpulan titik yang disebut x dan f (x). Satu lapisan tersembunyi akan membangun jaringan sederhana ini.
Kode untuk penjelasan hidden layer dari perceptron adalah seperti dibawah ini -
#Importing the necessary modules
import tensorflow as tf
import numpy as np
import math, random
import matplotlib.pyplot as plt
np.random.seed(1000)
function_to_learn = lambda x: np.cos(x) + 0.1*np.random.randn(*x.shape)
layer_1_neurons = 10
NUM_points = 1000
#Training the parameters
batch_size = 100
NUM_EPOCHS = 1500
all_x = np.float32(np.random.uniform(-2*math.pi, 2*math.pi, (1, NUM_points))).T
np.random.shuffle(all_x)
train_size = int(900)
#Training the first 700 points in the given set x_training = all_x[:train_size]
y_training = function_to_learn(x_training)
#Training the last 300 points in the given set x_validation = all_x[train_size:]
y_validation = function_to_learn(x_validation)
plt.figure(1)
plt.scatter(x_training, y_training, c = 'blue', label = 'train')
plt.scatter(x_validation, y_validation, c = 'pink', label = 'validation')
plt.legend()
plt.show()
X = tf.placeholder(tf.float32, [None, 1], name = "X")
Y = tf.placeholder(tf.float32, [None, 1], name = "Y")
#first layer
#Number of neurons = 10
w_h = tf.Variable(
tf.random_uniform([1, layer_1_neurons],\ minval = -1, maxval = 1, dtype = tf.float32))
b_h = tf.Variable(tf.zeros([1, layer_1_neurons], dtype = tf.float32))
h = tf.nn.sigmoid(tf.matmul(X, w_h) + b_h)
#output layer
#Number of neurons = 10
w_o = tf.Variable(
tf.random_uniform([layer_1_neurons, 1],\ minval = -1, maxval = 1, dtype = tf.float32))
b_o = tf.Variable(tf.zeros([1, 1], dtype = tf.float32))
#build the model
model = tf.matmul(h, w_o) + b_o
#minimize the cost function (model - Y)
train_op = tf.train.AdamOptimizer().minimize(tf.nn.l2_loss(model - Y))
#Start the Learning phase
sess = tf.Session() sess.run(tf.initialize_all_variables())
errors = []
for i in range(NUM_EPOCHS):
for start, end in zip(range(0, len(x_training), batch_size),\
range(batch_size, len(x_training), batch_size)):
sess.run(train_op, feed_dict = {X: x_training[start:end],\ Y: y_training[start:end]})
cost = sess.run(tf.nn.l2_loss(model - y_validation),\ feed_dict = {X:x_validation})
errors.append(cost)
if i%100 == 0:
print("epoch %d, cost = %g" % (i, cost))
plt.plot(errors,label='MLP Function Approximation') plt.xlabel('epochs')
plt.ylabel('cost')
plt.legend()
plt.show()
Keluaran
Berikut adalah representasi dari pendekatan lapisan fungsi -
Di sini dua data direpresentasikan dalam bentuk W. Kedua data tersebut adalah: train dan validasi yang direpresentasikan dalam warna berbeda seperti yang terlihat di bagian legenda.
Pengoptimal adalah kelas yang diperluas, yang menyertakan informasi tambahan untuk melatih model tertentu. Kelas pengoptimal diinisialisasi dengan parameter yang diberikan, tetapi penting untuk diingat bahwa Tensor tidak diperlukan. Pengoptimal digunakan untuk meningkatkan kecepatan dan performa untuk melatih model tertentu.
Pengoptimal dasar TensorFlow adalah -
tf.train.Optimizer
Kelas ini didefinisikan di jalur tensorflow / python / training / optimizer.py yang ditentukan.
Berikut adalah beberapa pengoptimal di Tensorflow -
- Penurunan Stochastic Gradient
- Penurunan Gradien Stochastic dengan pemotongan gradien
- Momentum
- Momentum Nesterov
- Adagrad
- Adadelta
- RMSProp
- Adam
- Adamax
- SMORMS3
Kami akan fokus pada penurunan Gradien Stochastic. Ilustrasi untuk membuat pengoptimal untuk hal yang sama disebutkan di bawah -
def sgd(cost, params, lr = np.float32(0.01)):
g_params = tf.gradients(cost, params)
updates = []
for param, g_param in zip(params, g_params):
updates.append(param.assign(param - lr*g_param))
return updates
Parameter dasar ditentukan dalam fungsi tertentu. Di bab selanjutnya, kami akan fokus pada Pengoptimalan Penurunan Gradien dengan penerapan pengoptimal.
Dalam bab ini, kita akan mempelajari implementasi XOR menggunakan TensorFlow. Sebelum memulai implementasi XOR di TensorFlow, mari kita lihat nilai tabel XOR. Ini akan membantu kami memahami proses enkripsi dan dekripsi.
SEBUAH | B | SEBUAH XOR B |
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
Metode enkripsi XOR Cipher pada dasarnya digunakan untuk mengenkripsi data yang sulit dipecahkan dengan metode brute force, yaitu dengan menghasilkan kunci enkripsi acak yang sesuai dengan kunci yang sesuai.
Konsep implementasi dengan XOR Cipher adalah untuk mendefinisikan kunci enkripsi XOR dan kemudian melakukan operasi XOR dari karakter dalam string yang ditentukan dengan kunci ini, yang coba dienkripsi oleh pengguna. Sekarang kita akan fokus pada implementasi XOR menggunakan TensorFlow, yang disebutkan di bawah -
#Declaring necessary modules
import tensorflow as tf
import numpy as np
"""
A simple numpy implementation of a XOR gate to understand the backpropagation
algorithm
"""
x = tf.placeholder(tf.float64,shape = [4,2],name = "x")
#declaring a place holder for input x
y = tf.placeholder(tf.float64,shape = [4,1],name = "y")
#declaring a place holder for desired output y
m = np.shape(x)[0]#number of training examples
n = np.shape(x)[1]#number of features
hidden_s = 2 #number of nodes in the hidden layer
l_r = 1#learning rate initialization
theta1 = tf.cast(tf.Variable(tf.random_normal([3,hidden_s]),name = "theta1"),tf.float64)
theta2 = tf.cast(tf.Variable(tf.random_normal([hidden_s+1,1]),name = "theta2"),tf.float64)
#conducting forward propagation
a1 = tf.concat([np.c_[np.ones(x.shape[0])],x],1)
#the weights of the first layer are multiplied by the input of the first layer
z1 = tf.matmul(a1,theta1)
#the input of the second layer is the output of the first layer, passed through the
activation function and column of biases is added
a2 = tf.concat([np.c_[np.ones(x.shape[0])],tf.sigmoid(z1)],1)
#the input of the second layer is multiplied by the weights
z3 = tf.matmul(a2,theta2)
#the output is passed through the activation function to obtain the final probability
h3 = tf.sigmoid(z3)
cost_func = -tf.reduce_sum(y*tf.log(h3)+(1-y)*tf.log(1-h3),axis = 1)
#built in tensorflow optimizer that conducts gradient descent using specified
learning rate to obtain theta values
optimiser = tf.train.GradientDescentOptimizer(learning_rate = l_r).minimize(cost_func)
#setting required X and Y values to perform XOR operation
X = [[0,0],[0,1],[1,0],[1,1]]
Y = [[0],[1],[1],[0]]
#initializing all variables, creating a session and running a tensorflow session
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
#running gradient descent for each iteration and printing the hypothesis
obtained using the updated theta values
for i in range(100000):
sess.run(optimiser, feed_dict = {x:X,y:Y})#setting place holder values using feed_dict
if i%100==0:
print("Epoch:",i)
print("Hyp:",sess.run(h3,feed_dict = {x:X,y:Y}))
Baris kode di atas menghasilkan output seperti yang ditunjukkan pada gambar di bawah -
Optimasi penurunan gradien dianggap sebagai konsep penting dalam ilmu data.
Pertimbangkan langkah-langkah yang ditunjukkan di bawah ini untuk memahami implementasi pengoptimalan penurunan gradien -
Langkah 1
Sertakan modul yang diperlukan dan deklarasi variabel x dan y yang akan digunakan untuk mendefinisikan optimasi penurunan gradien.
import tensorflow as tf
x = tf.Variable(2, name = 'x', dtype = tf.float32)
log_x = tf.log(x)
log_x_squared = tf.square(log_x)
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(log_x_squared)
Langkah 2
Inisialisasi variabel yang diperlukan dan panggil pengoptimal untuk menentukan dan memanggilnya dengan fungsi masing-masing.
init = tf.initialize_all_variables()
def optimize():
with tf.Session() as session:
session.run(init)
print("starting at", "x:", session.run(x), "log(x)^2:", session.run(log_x_squared))
for step in range(10):
session.run(train)
print("step", step, "x:", session.run(x), "log(x)^2:", session.run(log_x_squared))
optimize()
Baris kode di atas menghasilkan output seperti yang ditunjukkan pada gambar di bawah -
Kita dapat melihat bahwa epoch dan iterasi yang diperlukan dihitung seperti yang ditunjukkan pada output.
Persamaan diferensial parsial (PDE) adalah persamaan diferensial, yang melibatkan turunan parsial dengan fungsi yang tidak diketahui dari beberapa variabel independen. Dengan mengacu pada persamaan diferensial parsial, kami akan fokus pada pembuatan grafik baru.
Mari kita asumsikan ada kolam dengan ukuran 500 * 500 persegi -
N = 500
Sekarang, kita akan menghitung persamaan diferensial parsial dan membentuk grafik masing-masing dengan menggunakannya. Pertimbangkan langkah-langkah yang diberikan di bawah ini untuk menghitung grafik.
Step 1 - Impor perpustakaan untuk simulasi.
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
Step 2 - Menyertakan fungsi untuk transformasi larik 2D menjadi kernel konvolusi dan operasi konvolusi 2D yang disederhanakan.
def make_kernel(a):
a = np.asarray(a)
a = a.reshape(list(a.shape) + [1,1])
return tf.constant(a, dtype=1)
def simple_conv(x, k):
"""A simplified 2D convolution operation"""
x = tf.expand_dims(tf.expand_dims(x, 0), -1)
y = tf.nn.depthwise_conv2d(x, k, [1, 1, 1, 1], padding = 'SAME')
return y[0, :, :, 0]
def laplace(x):
"""Compute the 2D laplacian of an array"""
laplace_k = make_kernel([[0.5, 1.0, 0.5], [1.0, -6., 1.0], [0.5, 1.0, 0.5]])
return simple_conv(x, laplace_k)
sess = tf.InteractiveSession()
Step 3 - Sertakan jumlah iterasi dan hitung grafik untuk menampilkan catatan yang sesuai.
N = 500
# Initial Conditions -- some rain drops hit a pond
# Set everything to zero
u_init = np.zeros([N, N], dtype = np.float32)
ut_init = np.zeros([N, N], dtype = np.float32)
# Some rain drops hit a pond at random points
for n in range(100):
a,b = np.random.randint(0, N, 2)
u_init[a,b] = np.random.uniform()
plt.imshow(u_init)
plt.show()
# Parameters:
# eps -- time resolution
# damping -- wave damping
eps = tf.placeholder(tf.float32, shape = ())
damping = tf.placeholder(tf.float32, shape = ())
# Create variables for simulation state
U = tf.Variable(u_init)
Ut = tf.Variable(ut_init)
# Discretized PDE update rules
U_ = U + eps * Ut
Ut_ = Ut + eps * (laplace(U) - damping * Ut)
# Operation to update the state
step = tf.group(U.assign(U_), Ut.assign(Ut_))
# Initialize state to initial conditions
tf.initialize_all_variables().run()
# Run 1000 steps of PDE
for i in range(1000):
# Step simulation
step.run({eps: 0.03, damping: 0.04})
# Visualize every 50 steps
if i % 500 == 0:
plt.imshow(U.eval())
plt.show()
Grafik diplot seperti yang ditunjukkan di bawah ini -
TensorFlow menyertakan fitur khusus pengenalan gambar dan gambar ini disimpan dalam folder tertentu. Dengan gambar yang relatif sama, akan mudah menerapkan logika ini untuk tujuan keamanan.
Struktur folder implementasi kode pengenalan gambar adalah seperti yang ditunjukkan di bawah ini -
Dataset_image menyertakan gambar terkait, yang perlu dimuat. Kami akan fokus pada pengenalan gambar dengan logo kami ditentukan di dalamnya. Gambar dimuat dengan skrip "load_data.py", yang membantu membuat catatan tentang berbagai modul pengenalan gambar di dalamnya.
import pickle
from sklearn.model_selection import train_test_split
from scipy import misc
import numpy as np
import os
label = os.listdir("dataset_image")
label = label[1:]
dataset = []
for image_label in label:
images = os.listdir("dataset_image/"+image_label)
for image in images:
img = misc.imread("dataset_image/"+image_label+"/"+image)
img = misc.imresize(img, (64, 64))
dataset.append((img,image_label))
X = []
Y = []
for input,image_label in dataset:
X.append(input)
Y.append(label.index(image_label))
X = np.array(X)
Y = np.array(Y)
X_train,y_train, = X,Y
data_set = (X_train,y_train)
save_label = open("int_to_word_out.pickle","wb")
pickle.dump(label, save_label)
save_label.close()
Pelatihan gambar membantu dalam menyimpan pola yang dapat dikenali dalam folder tertentu.
import numpy
import matplotlib.pyplot as plt
from keras.layers import Dropout
from keras.layers import Flatten
from keras.constraints import maxnorm
from keras.optimizers import SGD
from keras.layers import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.utils import np_utils
from keras import backend as K
import load_data
from keras.models import Sequential
from keras.layers import Dense
import keras
K.set_image_dim_ordering('tf')
# fix random seed for reproducibility
seed = 7
numpy.random.seed(seed)
# load data
(X_train,y_train) = load_data.data_set
# normalize inputs from 0-255 to 0.0-1.0
X_train = X_train.astype('float32')
#X_test = X_test.astype('float32')
X_train = X_train / 255.0
#X_test = X_test / 255.0
# one hot encode outputs
y_train = np_utils.to_categorical(y_train)
#y_test = np_utils.to_categorical(y_test)
num_classes = y_train.shape[1]
# Create the model
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), padding = 'same',
activation = 'relu', kernel_constraint = maxnorm(3)))
model.add(Dropout(0.2))
model.add(Conv2D(32, (3, 3), activation = 'relu', padding = 'same',
kernel_constraint = maxnorm(3)))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Flatten())
model.add(Dense(512, activation = 'relu', kernel_constraint = maxnorm(3)))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation = 'softmax'))
# Compile model
epochs = 10
lrate = 0.01
decay = lrate/epochs
sgd = SGD(lr = lrate, momentum = 0.9, decay = decay, nesterov = False)
model.compile(loss = 'categorical_crossentropy', optimizer = sgd, metrics = ['accuracy'])
print(model.summary())
#callbacks = [keras.callbacks.EarlyStopping(
monitor = 'val_loss', min_delta = 0, patience = 0, verbose = 0, mode = 'auto')]
callbacks = [keras.callbacks.TensorBoard(log_dir='./logs',
histogram_freq = 0, batch_size = 32, write_graph = True, write_grads = False,
write_images = True, embeddings_freq = 0, embeddings_layer_names = None,
embeddings_metadata = None)]
# Fit the model
model.fit(X_train, y_train, epochs = epochs,
batch_size = 32,shuffle = True,callbacks = callbacks)
# Final evaluation of the model
scores = model.evaluate(X_train, y_train, verbose = 0)
print("Accuracy: %.2f%%" % (scores[1]*100))
# serialize model to JSONx
model_json = model.to_json()
with open("model_face.json", "w") as json_file:
json_file.write(model_json)
# serialize weights to HDF5
model.save_weights("model_face.h5")
print("Saved model to disk")
Baris kode di atas menghasilkan output seperti yang ditunjukkan di bawah ini -
Dalam bab ini, kita akan memahami berbagai aspek pelatihan jaringan neural yang dapat diimplementasikan menggunakan framework TensorFlow.
Berikut ini sepuluh rekomendasi yang dapat dievaluasi -
Propagasi Balik
Propagasi balik adalah metode sederhana untuk menghitung turunan parsial, yang mencakup bentuk dasar komposisi yang paling cocok untuk jaringan saraf.
Penurunan Gradien Stochastic
Dalam penurunan gradien stokastik, a batchadalah jumlah total contoh, yang digunakan pengguna untuk menghitung gradien dalam satu iterasi. Sejauh ini, diasumsikan bahwa batch adalah seluruh kumpulan data. Ilustrasi terbaik bekerja pada skala Google; kumpulan data sering kali berisi miliaran atau bahkan ratusan miliar contoh.
Peluruhan Kecepatan Pembelajaran
Mengadaptasi kecepatan pembelajaran adalah salah satu fitur terpenting dalam pengoptimalan penurunan gradien. Ini penting untuk implementasi TensorFlow.
Keluar
Jaringan neural dalam dengan sejumlah besar parameter membentuk sistem pembelajaran mesin yang andal. Namun, pemasangan yang berlebihan adalah masalah serius dalam jaringan semacam itu.
Max Pooling
Max pooling adalah proses diskritisasi berbasis sampel. Tujuannya adalah untuk down-sample representasi input, yang mengurangi dimensionalitas dengan asumsi yang diperlukan.
Memori Jangka Pendek Panjang (LSTM)
LSTM mengontrol keputusan tentang input apa yang harus diambil dalam neuron yang ditentukan. Ini mencakup kontrol untuk memutuskan apa yang harus dihitung dan keluaran apa yang harus dihasilkan.