Keras-컨볼 루션 신경망

MPL에서 다음으로 모델을 수정 해 보겠습니다. Convolution Neural Network (CNN) 우리의 이전 숫자 식별 문제에 대해.

CNN은 아래와 같이 표현할 수 있습니다.

모델의 핵심 기능은 다음과 같습니다.

  • 입력 레이어는 (1, 8, 28) 값으로 구성됩니다.

  • 첫 번째 레이어, Conv2D 32 개의 필터와 커널 크기 (3,3)의 'relu'활성화 함수로 구성됩니다.

  • 두 번째 레이어, Conv2D 64 개의 필터와 커널 크기 (3,3)의 'relu'활성화 함수로 구성됩니다.

  • Thrid 레이어, MaxPooling 풀 크기는 (2, 2)입니다.

  • 다섯 번째 레이어, Flatten 모든 입력을 단일 차원으로 평면화하는 데 사용됩니다.

  • 여섯 번째 레이어, Dense 128 개의 뉴런과 'relu'활성화 기능으로 구성됩니다.

  • 일곱 번째 층, Dropout 값으로 0.5가 있습니다.

  • 여덟 번째 및 마지막 레이어는 10 개의 뉴런과 'softmax'활성화 함수로 구성됩니다.

  • 사용하다 categorical_crossentropy 손실 함수로.

  • 사용하다 Adadelta() Optimizer로.

  • 사용하다 accuracy 메트릭으로.

  • 128을 배치 크기로 사용하십시오.

  • 20을 시대로 사용하십시오.

Step 1 − Import the modules

필요한 모듈을 가져 오겠습니다.

import keras 
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense, Dropout, Flatten 
from keras.layers import Conv2D, MaxPooling2D 
from keras import backend as K 
import numpy as np

Step 2 − Load data

mnist 데이터 세트를 가져 오겠습니다.

(x_train, y_train), (x_test, y_test) = mnist.load_data()

Step 3 − Process the data

모델에 따라 데이터 세트를 변경하여 모델에 입력 할 수 있도록하겠습니다.

img_rows, img_cols = 28, 28 

if K.image_data_format() == 'channels_first': 
   x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols) 
   x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols) 
   input_shape = (1, img_rows, img_cols) 
else: 
   x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) 
   x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) 
   input_shape = (img_rows, img_cols, 1) 
   
x_train = x_train.astype('float32') 
x_test = x_test.astype('float32') 
x_train /= 255 
x_test /= 255 

y_train = keras.utils.to_categorical(y_train, 10) 
y_test = keras.utils.to_categorical(y_test, 10)

데이터 처리는 입력 데이터의 모양과 이미지 형식 구성을 제외하고 MPL 모델과 유사합니다.

Step 4 − Create the model

실제 모델을 만들어 보겠습니다.

model = Sequential() 
model.add(Conv2D(32, kernel_size = (3, 3),  
   activation = 'relu', input_shape = input_shape)) 
model.add(Conv2D(64, (3, 3), activation = 'relu')) 
model.add(MaxPooling2D(pool_size = (2, 2))) 
model.add(Dropout(0.25)) model.add(Flatten()) 
model.add(Dense(128, activation = 'relu')) 
model.add(Dropout(0.5)) 
model.add(Dense(10, activation = 'softmax'))

Step 5 − Compile the model

선택한 손실 함수, 최적화 프로그램 및 메트릭을 사용하여 모델을 컴파일 해 보겠습니다.

model.compile(loss = keras.losses.categorical_crossentropy, 
   optimizer = keras.optimizers.Adadelta(), metrics = ['accuracy'])

Step 6 − Train the model

다음을 사용하여 모델을 훈련 시키십시오. fit() 방법.

model.fit(
   x_train, y_train, 
   batch_size = 128, 
   epochs = 12, 
   verbose = 1, 
   validation_data = (x_test, y_test)
)

응용 프로그램을 실행하면 아래 정보가 출력됩니다.

Train on 60000 samples, validate on 10000 samples Epoch 1/12 
60000/60000 [==============================] - 84s 1ms/step - loss: 0.2687 
- acc: 0.9173 - val_loss: 0.0549 - val_acc: 0.9827 Epoch 2/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0899 
- acc: 0.9737 - val_loss: 0.0452 - val_acc: 0.9845 Epoch 3/12 
60000/60000 [==============================] - 83s 1ms/step - loss: 0.0666 
- acc: 0.9804 - val_loss: 0.0362 - val_acc: 0.9879 Epoch 4/12 
60000/60000 [==============================] - 81s 1ms/step - loss: 0.0564 
- acc: 0.9830 - val_loss: 0.0336 - val_acc: 0.9890 Epoch 5/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0472 
- acc: 0.9861 - val_loss: 0.0312 - val_acc: 0.9901 Epoch 6/12 
60000/60000 [==============================] - 83s 1ms/step - loss: 0.0414 
- acc: 0.9877 - val_loss: 0.0306 - val_acc: 0.9902 Epoch 7/12 
60000/60000 [==============================] - 89s 1ms/step - loss: 0.0375 
-acc: 0.9883 - val_loss: 0.0281 - val_acc: 0.9906 Epoch 8/12 
60000/60000 [==============================] - 91s 2ms/step - loss: 0.0339 
- acc: 0.9893 - val_loss: 0.0280 - val_acc: 0.9912 Epoch 9/12 
60000/60000 [==============================] - 89s 1ms/step - loss: 0.0325 
- acc: 0.9901 - val_loss: 0.0260 - val_acc: 0.9909 Epoch 10/12 
60000/60000 [==============================] - 89s 1ms/step - loss: 0.0284 
- acc: 0.9910 - val_loss: 0.0250 - val_acc: 0.9919 Epoch 11/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0287 
- acc: 0.9907 - val_loss: 0.0264 - val_acc: 0.9916 Epoch 12/12 
60000/60000 [==============================] - 86s 1ms/step - loss: 0.0265 
- acc: 0.9920 - val_loss: 0.0249 - val_acc: 0.9922

Step 7 − Evaluate the model

테스트 데이터를 사용하여 모델을 평가 해 보겠습니다.

score = model.evaluate(x_test, y_test, verbose = 0) 

print('Test loss:', score[0]) 
print('Test accuracy:', score[1])

위의 코드를 실행하면 아래 정보가 출력됩니다.

Test loss: 0.024936060590433316 
Test accuracy: 0.9922

테스트 정확도는 99.22 %입니다. 우리는 손글씨 숫자를 식별하는 최상의 모델을 만들었습니다.

Step 8 − Predict

마지막으로 다음과 같이 이미지에서 숫자를 예측하십시오.

pred = model.predict(x_test) 
pred = np.argmax(pred, axis = 1)[:5] 
label = np.argmax(y_test,axis = 1)[:5] 

print(pred) 
print(label)

위 응용 프로그램의 출력은 다음과 같습니다.

[7 2 1 0 4] 
[7 2 1 0 4]

두 배열의 출력은 동일하며 모델이 처음 5 개의 이미지를 올바르게 예측 함을 나타냅니다.