PyTorch - आवर्तक तंत्रिका नेटवर्क
आवर्तक तंत्रिका नेटवर्क एक प्रकार का गहन शिक्षण-उन्मुख एल्गोरिथ्म है जो क्रमबद्ध दृष्टिकोण का अनुसरण करता है। तंत्रिका नेटवर्क में, हम हमेशा यह मानते हैं कि प्रत्येक इनपुट और आउटपुट अन्य सभी परतों से स्वतंत्र है। इस प्रकार के तंत्रिका नेटवर्क को आवर्तक कहा जाता है क्योंकि वे क्रमबद्ध तरीके से गणितीय गणना करते हैं और एक के बाद एक कार्य पूरा करते हैं।
नीचे दिया गया आरेख पूर्ण दृष्टिकोण और आवर्तक तंत्रिका नेटवर्क के कार्य को निर्दिष्ट करता है -
उपरोक्त आकृति में, c1, c2, c3 और X1 को इनपुट के रूप में माना जाता है, जिसमें कुछ छिपे हुए इनपुट मान शामिल हैं जैसे कि h1, h2 और h3 ओ 1 के संबंधित आउटपुट को वितरित करते हैं। अब हम पुनरावर्ती तंत्रिका नेटवर्क की सहायता से साइन लहर बनाने के लिए PyTorch को लागू करने पर ध्यान केंद्रित करेंगे।
प्रशिक्षण के दौरान, हम एक समय में एक डेटा बिंदु के साथ अपने मॉडल के लिए एक प्रशिक्षण दृष्टिकोण का पालन करेंगे। इनपुट अनुक्रम x में 20 डेटा बिंदु होते हैं, और लक्ष्य अनुक्रम को इनपुट अनुक्रम के समान माना जाता है।
चरण 1
नीचे दिए गए कोड का उपयोग करके आवर्तक तंत्रिका नेटवर्क को लागू करने के लिए आवश्यक पैकेज आयात करें -
import torch
from torch.autograd import Variable
import numpy as np
import pylab as pl
import torch.nn.init as init
चरण 2
हम मॉडल हाइपर मापदंडों को इनपुट लेयर के आकार के साथ 7 पर सेट करेंगे। लक्ष्य अनुक्रम बनाने के लिए 6 संदर्भ न्यूरॉन्स और 1 इनपुट न्यूरॉन होंगे।
dtype = torch.FloatTensor
input_size, hidden_size, output_size = 7, 6, 1
epochs = 300
seq_length = 20
lr = 0.1
data_time_steps = np.linspace(2, 10, seq_length + 1)
data = np.sin(data_time_steps)
data.resize((seq_length + 1, 1))
x = Variable(torch.Tensor(data[:-1]).type(dtype), requires_grad=False)
y = Variable(torch.Tensor(data[1:]).type(dtype), requires_grad=False)
हम प्रशिक्षण डेटा उत्पन्न करेंगे, जहां x इनपुट डेटा अनुक्रम है और y के लिए लक्ष्य अनुक्रम आवश्यक है।
चरण 3
शून्य अर्थ के साथ सामान्य वितरण का उपयोग करके आवर्तक तंत्रिका नेटवर्क में वज़न को आरंभ किया जाता है। W1 इनपुट चर की स्वीकृति का प्रतिनिधित्व करेगा और w2 आउटपुट को दर्शाएगा जो नीचे दिखाया गया है -
w1 = torch.FloatTensor(input_size,
hidden_size).type(dtype)
init.normal(w1, 0.0, 0.4)
w1 = Variable(w1, requires_grad = True)
w2 = torch.FloatTensor(hidden_size, output_size).type(dtype)
init.normal(w2, 0.0, 0.3)
w2 = Variable(w2, requires_grad = True)
चरण 4
अब, आगे फ़ीड के लिए एक फ़ंक्शन बनाना महत्वपूर्ण है जो विशिष्ट रूप से तंत्रिका नेटवर्क को परिभाषित करता है।
def forward(input, context_state, w1, w2):
xh = torch.cat((input, context_state), 1)
context_state = torch.tanh(xh.mm(w1))
out = context_state.mm(w2)
return (out, context_state)
चरण 5
अगला कदम आवर्तक तंत्रिका नेटवर्क के साइन वेव कार्यान्वयन की प्रशिक्षण प्रक्रिया शुरू करना है। बाहरी लूप प्रत्येक लूप पर पुनरावृति करता है और आंतरिक लूप अनुक्रम के तत्व के माध्यम से पुनरावृत्त करता है। यहां, हम मीन स्क्वायर एरर (MSE) की गणना भी करेंगे जो निरंतर चर की भविष्यवाणी में मदद करता है।
for i in range(epochs):
total_loss = 0
context_state = Variable(torch.zeros((1, hidden_size)).type(dtype), requires_grad = True)
for j in range(x.size(0)):
input = x[j:(j+1)]
target = y[j:(j+1)]
(pred, context_state) = forward(input, context_state, w1, w2)
loss = (pred - target).pow(2).sum()/2
total_loss += loss
loss.backward()
w1.data -= lr * w1.grad.data
w2.data -= lr * w2.grad.data
w1.grad.data.zero_()
w2.grad.data.zero_()
context_state = Variable(context_state.data)
if i % 10 == 0:
print("Epoch: {} loss {}".format(i, total_loss.data[0]))
context_state = Variable(torch.zeros((1, hidden_size)).type(dtype), requires_grad = False)
predictions = []
for i in range(x.size(0)):
input = x[i:i+1]
(pred, context_state) = forward(input, context_state, w1, w2)
context_state = context_state
predictions.append(pred.data.numpy().ravel()[0])
चरण 6
अब, जिस तरह से जरूरत है, साइन लहर को प्लॉट करने का समय आ गया है।
pl.scatter(data_time_steps[:-1], x.data.numpy(), s = 90, label = "Actual")
pl.scatter(data_time_steps[1:], predictions, label = "Predicted")
pl.legend()
pl.show()
उत्पादन
उपरोक्त प्रक्रिया के लिए आउटपुट निम्नानुसार है -