Keras - Red neuronal de convolución

Modifiquemos el modelo de MPL a Convolution Neural Network (CNN) para nuestro problema de identificación de dígitos anterior.

CNN se puede representar de la siguiente manera:

Las características principales del modelo son las siguientes:

  • La capa de entrada consta de (1, 8, 28) valores.

  • Primera capa, Conv2D consta de 32 filtros y función de activación 'relu' con tamaño de kernel, (3,3).

  • Segunda capa, Conv2D consta de 64 filtros y función de activación 'relu' con tamaño de kernel, (3,3).

  • Tercera capa, MaxPooling Tiene piscina de (2, 2).

  • Quinta capa, Flatten se utiliza para aplanar toda su entrada en una sola dimensión.

  • Sexta capa, Dense consta de 128 neuronas y función de activación 'relu'.

  • Séptima capa, Dropout tiene 0,5 como valor.

  • La octava y última capa consta de 10 neuronas y la función de activación 'softmax'.

  • Utilizar categorical_crossentropy como función de pérdida.

  • Utilizar Adadelta() como Optimizador.

  • Utilizar accuracy como métricas.

  • Utilice 128 como tamaño de lote.

  • Usa 20 como épocas.

Step 1 − Import the modules

Importamos los módulos necesarios.

import keras 
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense, Dropout, Flatten 
from keras.layers import Conv2D, MaxPooling2D 
from keras import backend as K 
import numpy as np

Step 2 − Load data

Importemos el conjunto de datos mnist.

(x_train, y_train), (x_test, y_test) = mnist.load_data()

Step 3 − Process the data

Cambiemos el conjunto de datos de acuerdo con nuestro modelo, para que se pueda incorporar a nuestro modelo.

img_rows, img_cols = 28, 28 

if K.image_data_format() == 'channels_first': 
   x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols) 
   x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols) 
   input_shape = (1, img_rows, img_cols) 
else: 
   x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) 
   x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) 
   input_shape = (img_rows, img_cols, 1) 
   
x_train = x_train.astype('float32') 
x_test = x_test.astype('float32') 
x_train /= 255 
x_test /= 255 

y_train = keras.utils.to_categorical(y_train, 10) 
y_test = keras.utils.to_categorical(y_test, 10)

El procesamiento de datos es similar al modelo MPL excepto la forma de los datos de entrada y la configuración del formato de imagen.

Step 4 − Create the model

Creemos el modelo real.

model = Sequential() 
model.add(Conv2D(32, kernel_size = (3, 3),  
   activation = 'relu', input_shape = input_shape)) 
model.add(Conv2D(64, (3, 3), activation = 'relu')) 
model.add(MaxPooling2D(pool_size = (2, 2))) 
model.add(Dropout(0.25)) model.add(Flatten()) 
model.add(Dense(128, activation = 'relu')) 
model.add(Dropout(0.5)) 
model.add(Dense(10, activation = 'softmax'))

Step 5 − Compile the model

Compilemos el modelo utilizando la función de pérdida seleccionada, el optimizador y las métricas.

model.compile(loss = keras.losses.categorical_crossentropy, 
   optimizer = keras.optimizers.Adadelta(), metrics = ['accuracy'])

Step 6 − Train the model

Entrenemos el modelo usando fit() método.

model.fit(
   x_train, y_train, 
   batch_size = 128, 
   epochs = 12, 
   verbose = 1, 
   validation_data = (x_test, y_test)
)

La ejecución de la aplicación generará la siguiente información:

Train on 60000 samples, validate on 10000 samples Epoch 1/12 
60000/60000 [==============================] - 84s 1ms/step - loss: 0.2687 
- acc: 0.9173 - val_loss: 0.0549 - val_acc: 0.9827 Epoch 2/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0899 
- acc: 0.9737 - val_loss: 0.0452 - val_acc: 0.9845 Epoch 3/12 
60000/60000 [==============================] - 83s 1ms/step - loss: 0.0666 
- acc: 0.9804 - val_loss: 0.0362 - val_acc: 0.9879 Epoch 4/12 
60000/60000 [==============================] - 81s 1ms/step - loss: 0.0564 
- acc: 0.9830 - val_loss: 0.0336 - val_acc: 0.9890 Epoch 5/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0472 
- acc: 0.9861 - val_loss: 0.0312 - val_acc: 0.9901 Epoch 6/12 
60000/60000 [==============================] - 83s 1ms/step - loss: 0.0414 
- acc: 0.9877 - val_loss: 0.0306 - val_acc: 0.9902 Epoch 7/12 
60000/60000 [==============================] - 89s 1ms/step - loss: 0.0375 
-acc: 0.9883 - val_loss: 0.0281 - val_acc: 0.9906 Epoch 8/12 
60000/60000 [==============================] - 91s 2ms/step - loss: 0.0339 
- acc: 0.9893 - val_loss: 0.0280 - val_acc: 0.9912 Epoch 9/12 
60000/60000 [==============================] - 89s 1ms/step - loss: 0.0325 
- acc: 0.9901 - val_loss: 0.0260 - val_acc: 0.9909 Epoch 10/12 
60000/60000 [==============================] - 89s 1ms/step - loss: 0.0284 
- acc: 0.9910 - val_loss: 0.0250 - val_acc: 0.9919 Epoch 11/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0287 
- acc: 0.9907 - val_loss: 0.0264 - val_acc: 0.9916 Epoch 12/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0265 
- acc: 0.9920 - val_loss: 0.0249 - val_acc: 0.9922

Step 7 − Evaluate the model

Evaluemos el modelo usando datos de prueba.

score = model.evaluate(x_test, y_test, verbose = 0) 

print('Test loss:', score[0]) 
print('Test accuracy:', score[1])

La ejecución del código anterior generará la siguiente información:

Test loss: 0.024936060590433316 
Test accuracy: 0.9922

La precisión de la prueba es del 99,22%. Hemos creado el mejor modelo para identificar los dígitos de la escritura a mano.

Step 8 − Predict

Finalmente, predice el dígito a partir de imágenes como se muestra a continuación:

pred = model.predict(x_test) 
pred = np.argmax(pred, axis = 1)[:5] 
label = np.argmax(y_test,axis = 1)[:5] 

print(pred) 
print(label)

El resultado de la aplicación anterior es el siguiente:

[7 2 1 0 4] 
[7 2 1 0 4]

La salida de ambas matrices es idéntica e indica que nuestro modelo predice correctamente las primeras cinco imágenes.