Membuat Model Pembelajaran Mendalam

Model jaringan saraf kami akan terdiri dari tumpukan lapisan linier. Untuk mendefinisikan model seperti itu, kami memanggilSequential fungsi -

model = Sequential()

Lapisan Input

Kami mendefinisikan lapisan input, yang merupakan lapisan pertama di jaringan kami menggunakan pernyataan program berikut -

model.add(Dense(512, input_shape=(784,)))

Ini menciptakan lapisan dengan 512 node (neuron) dengan 784 node input. Ini digambarkan pada gambar di bawah ini -

Perhatikan bahwa semua node input terhubung sepenuhnya ke Layer 1, yaitu setiap node input terhubung ke semua 512 node dari Layer 1.

Selanjutnya, kita perlu menambahkan fungsi aktivasi untuk output Layer 1. Kita akan menggunakan ULT sebagai aktivasi kita. Fungsi aktivasi ditambahkan menggunakan pernyataan program berikut -

model.add(Activation('relu'))

Selanjutnya, kami menambahkan Dropout 20% menggunakan pernyataan di bawah ini. Dropout adalah teknik yang digunakan untuk mencegah model overfitting.

model.add(Dropout(0.2))

Pada titik ini, lapisan masukan kami sepenuhnya ditentukan. Selanjutnya, kami akan menambahkan lapisan tersembunyi.

Lapisan Tersembunyi

Lapisan tersembunyi kami akan terdiri dari 512 node. Masukan ke lapisan tersembunyi berasal dari lapisan masukan yang telah ditetapkan sebelumnya. Semua node terhubung sepenuhnya seperti pada kasus sebelumnya. Output dari lapisan tersembunyi akan menuju ke lapisan berikutnya dalam jaringan, yang akan menjadi lapisan akhir dan keluaran kami. Kami akan menggunakan aktivasi ULT yang sama seperti untuk lapisan sebelumnya dan putus sekolah sebesar 20%. Kode untuk menambahkan lapisan ini diberikan di sini -

model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.2))

Jaringan pada tahap ini dapat divisualisasikan sebagai berikut -

Selanjutnya, kami akan menambahkan lapisan terakhir ke jaringan kami, yang merupakan lapisan keluaran. Perhatikan bahwa Anda dapat menambahkan sejumlah lapisan tersembunyi menggunakan kode yang mirip dengan yang Anda gunakan di sini. Menambahkan lebih banyak lapisan akan membuat jaringan menjadi rumit untuk pelatihan; namun, memberikan keuntungan yang pasti dari hasil yang lebih baik dalam banyak kasus meskipun tidak semua.

Lapisan Keluaran

Lapisan keluaran hanya terdiri dari 10 node karena kami ingin mengklasifikasikan gambar yang diberikan dalam 10 digit berbeda. Kami menambahkan lapisan ini, menggunakan pernyataan berikut -

model.add(Dense(10))

Karena kami ingin mengklasifikasikan output dalam 10 unit berbeda, kami menggunakan aktivasi softmax. Dalam kasus ULT, hasilnya adalah biner. Kami menambahkan aktivasi menggunakan pernyataan berikut -

model.add(Activation('softmax'))

Pada titik ini, jaringan kami dapat divisualisasikan seperti yang ditunjukkan pada diagram di bawah ini -

Pada titik ini, model jaringan kami sepenuhnya ditentukan dalam perangkat lunak. Jalankan sel kode dan jika tidak ada kesalahan, Anda akan mendapatkan pesan konfirmasi di layar seperti yang ditunjukkan pada gambar di bawah -

Selanjutnya, kita perlu mengkompilasi modelnya.