केरस - समय श्रृंखला भविष्यवाणी LSTM RNN का उपयोग कर
इस अध्याय में, आइए अनुक्रम विश्लेषण करने के लिए एक सरल लॉन्ग शॉर्ट टर्म मेमोरी (LSTM) आधारित RNN लिखें। एक अनुक्रम मानों का एक समूह है जहां प्रत्येक मान समय के एक विशेष उदाहरण से मेल खाता है। आइए एक वाक्य पढ़ने के सरल उदाहरण पर विचार करें। किसी वाक्य को पढ़ने और समझने के लिए दिए गए क्रम में शब्द को पढ़ना और दिए गए संदर्भ में प्रत्येक शब्द और उसके अर्थ को समझने की कोशिश करना और अंत में वाक्य को सकारात्मक या नकारात्मक भावना में समझना शामिल है।
यहां, शब्दों को मूल्यों के रूप में माना जाता है, और पहला मूल्य पहले शब्द से मेल खाता है, दूसरा मूल्य दूसरे शब्द से मेल खाता है, आदि, और आदेश सख्ती से बनाए रखा जाएगा। Sequence Analysis दिए गए पाठ की भावना विश्लेषण को खोजने के लिए अक्सर प्राकृतिक भाषा प्रसंस्करण में उपयोग किया जाता है।
आइए हम IMDB मूवी समीक्षाओं का विश्लेषण करने और इसकी सकारात्मक / नकारात्मक भावना का पता लगाने के लिए एक LSTM मॉडल बनाएं।
अनुक्रम विश्लेषण के लिए मॉडल नीचे दिया जा सकता है -
मॉडल की मुख्य विशेषताएं इस प्रकार हैं -
128 परत के साथ एंबेडिंग लेयर का उपयोग करके इनपुट लेयर।
पहली परत, घने में सामान्य ड्रॉपआउट के साथ 128 इकाइयां होती हैं और आवर्तक ड्रॉपआउट 0.2 पर सेट होती हैं।
आउटपुट लेयर, Dense में 1 यूनिट और 'सिग्मॉइड' सक्रियण फ़ंक्शन होता है।
उपयोग binary_crossentropy हानि समारोह के रूप में।
उपयोग adam ऑप्टिमाइज़र के रूप में।
उपयोग accuracy मैट्रिक्स के रूप में।
32 का उपयोग बैच आकार के रूप में करें।
15 युगों के रूप में उपयोग करें।
शब्द की अधिकतम लंबाई के रूप में 80 का उपयोग करें।
किसी दिए गए वाक्य में शब्द की अधिकतम संख्या के रूप में 2000 का उपयोग करें।
चरण 1: मॉड्यूल आयात करें
हमें आवश्यक मॉड्यूल आयात करते हैं।
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Dense, Embedding
from keras.layers import LSTM
from keras.datasets import imdb
चरण 2: डेटा लोड करें
आइए हम imdb डेटासेट आयात करें।
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words = 2000)
यहाँ,
imdbKeras द्वारा प्रदान किया गया एक डेटासेट है। यह फिल्मों के संग्रह और उसकी समीक्षाओं का प्रतिनिधित्व करता है।
num_words समीक्षा में शब्दों की अधिकतम संख्या का प्रतिनिधित्व करें।
चरण 3: डेटा को संसाधित करें
आइए हम अपने मॉडल के अनुसार डेटासेट बदलते हैं, ताकि इसे हमारे मॉडल में फीड किया जा सके। नीचे दिए गए कोड का उपयोग करके डेटा को बदला जा सकता है -
x_train = sequence.pad_sequences(x_train, maxlen=80)
x_test = sequence.pad_sequences(x_test, maxlen=80)
यहाँ,
sequence.pad_sequences आकृति के साथ इनपुट डेटा की सूची में परिवर्तित करें, (data) आकार के 2 डी NumPy सरणी में (data, timesteps)। मूल रूप से, यह दिए गए डेटा में टाइमस्टेप अवधारणा को जोड़ता है। यह लंबाई के समय को उत्पन्न करता है,maxlen।
चरण 4: मॉडल बनाएं
हमें वास्तविक मॉडल बनाते हैं।
model = Sequential()
model.add(Embedding(2000, 128))
model.add(LSTM(128, dropout = 0.2, recurrent_dropout = 0.2))
model.add(Dense(1, activation = 'sigmoid'))
यहाँ,
हमने इस्तेमाल किया है Embedding layerइनपुट लेयर के रूप में और फिर LSTM लेयर को जोड़ा। अंत में, एDense layer का उपयोग आउटपुट लेयर के रूप में किया जाता है।
चरण 5: मॉडल को संकलित करें
आइए हम चयनित नुकसान फ़ंक्शन, ऑप्टिमाइज़र और मैट्रिक्स का उपयोग करके मॉडल को संकलित करते हैं।
model.compile(loss = 'binary_crossentropy',
optimizer = 'adam', metrics = ['accuracy'])
चरण 6: मॉडल को प्रशिक्षित करें
LLet हमें मॉडल का उपयोग करके प्रशिक्षित करते हैं fit() तरीका।
model.fit(
x_train, y_train,
batch_size = 32,
epochs = 15,
validation_data = (x_test, y_test)
)
एप्लिकेशन को निष्पादित करने से नीचे दी गई जानकारी का उत्पादन होगा -
Epoch 1/15 2019-09-24 01:19:01.151247: I
tensorflow/core/platform/cpu_feature_guard.cc:142]
Your CPU supports instructions that this
TensorFlow binary was not co mpiled to use: AVX2
25000/25000 [==============================] - 101s 4ms/step - loss: 0.4707
- acc: 0.7716 - val_loss: 0.3769 - val_acc: 0.8349 Epoch 2/15
25000/25000 [==============================] - 95s 4ms/step - loss: 0.3058
- acc: 0.8756 - val_loss: 0.3763 - val_acc: 0.8350 Epoch 3/15
25000/25000 [==============================] - 91s 4ms/step - loss: 0.2100
- acc: 0.9178 - val_loss: 0.5065 - val_acc: 0.8110 Epoch 4/15
25000/25000 [==============================] - 90s 4ms/step - loss: 0.1394
- acc: 0.9495 - val_loss: 0.6046 - val_acc: 0.8146 Epoch 5/15
25000/25000 [==============================] - 90s 4ms/step - loss: 0.0973
- acc: 0.9652 - val_loss: 0.5969 - val_acc: 0.8147 Epoch 6/15
25000/25000 [==============================] - 98s 4ms/step - loss: 0.0759
- acc: 0.9730 - val_loss: 0.6368 - val_acc: 0.8208 Epoch 7/15
25000/25000 [==============================] - 95s 4ms/step - loss: 0.0578
- acc: 0.9811 - val_loss: 0.6657 - val_acc: 0.8184 Epoch 8/15
25000/25000 [==============================] - 97s 4ms/step - loss: 0.0448
- acc: 0.9850 - val_loss: 0.7452 - val_acc: 0.8136 Epoch 9/15
25000/25000 [==============================] - 95s 4ms/step - loss: 0.0324
- acc: 0.9894 - val_loss: 0.7616 - val_acc: 0.8162Epoch 10/15
25000/25000 [==============================] - 100s 4ms/step - loss: 0.0247
- acc: 0.9922 - val_loss: 0.9654 - val_acc: 0.8148 Epoch 11/15
25000/25000 [==============================] - 99s 4ms/step - loss: 0.0169
- acc: 0.9946 - val_loss: 1.0013 - val_acc: 0.8104 Epoch 12/15
25000/25000 [==============================] - 90s 4ms/step - loss: 0.0154
- acc: 0.9948 - val_loss: 1.0316 - val_acc: 0.8100 Epoch 13/15
25000/25000 [==============================] - 89s 4ms/step - loss: 0.0113
- acc: 0.9963 - val_loss: 1.1138 - val_acc: 0.8108 Epoch 14/15
25000/25000 [==============================] - 89s 4ms/step - loss: 0.0106
- acc: 0.9971 - val_loss: 1.0538 - val_acc: 0.8102 Epoch 15/15
25000/25000 [==============================] - 89s 4ms/step - loss: 0.0090
- acc: 0.9972 - val_loss: 1.1453 - val_acc: 0.8129
25000/25000 [==============================] - 10s 390us/step
चरण 7 - मॉडल का मूल्यांकन करें
आइए हम परीक्षण डेटा का उपयोग करके मॉडल का मूल्यांकन करें।
score, acc = model.evaluate(x_test, y_test, batch_size = 32)
print('Test score:', score)
print('Test accuracy:', acc)
उपरोक्त कोड को निष्पादित करने से निम्न जानकारी उत्पन्न होगी -
Test score: 1.145306069601178
Test accuracy: 0.81292