पायथन डीप लर्निंग - कार्यान्वयन

डीप लर्निंग के इस कार्यान्वयन में, हमारा उद्देश्य एक निश्चित बैंक के लिए ग्राहक के आकर्षण या मंथन डेटा की भविष्यवाणी करना है - जो ग्राहक इस बैंक सेवा को छोड़ने की संभावना रखते हैं। डेटासेट का उपयोग अपेक्षाकृत छोटा है और इसमें 14 स्तंभों के साथ 10000 पंक्तियाँ हैं। हम एनाकोंडा वितरण का उपयोग कर रहे हैं, और थीनो, टेंसोरफ्लो और केरस जैसे ढांचे। Keras को Tensorflow और Theano के ऊपर बनाया गया है जो इसके बैकेंड के रूप में कार्य करता है।

# Artificial Neural Network
# Installing Theano
pip install --upgrade theano

# Installing Tensorflow
pip install –upgrade tensorflow

# Installing Keras
pip install --upgrade keras

चरण 1: डेटा प्रीप्रोसेसिंग

In[]:

# Importing the libraries
   import numpy as np
   import matplotlib.pyplot as plt
   import pandas as pd
 
# Importing the database
   dataset = pd.read_csv('Churn_Modelling.csv')

चरण 2

हम डेटासेट और लक्ष्य चर की विशेषताओं को बनाते हैं, जो स्तंभ 14 है, जिसे "बाहर" के रूप में लेबल किया गया है।

डेटा का प्रारंभिक रूप नीचे दिखाया गया है -

In[]:
X = dataset.iloc[:, 3:13].values
Y = dataset.iloc[:, 13].values
X

उत्पादन

चरण 3

Y

उत्पादन

array([1, 0, 1, ..., 1, 1, 0], dtype = int64)

चरण 4

हम स्ट्रिंग चर एन्कोडिंग द्वारा विश्लेषण को सरल बनाते हैं। हम 0 से n_classes-1 के बीच के मानों के साथ कॉलम में विभिन्न लेबल को स्वचालित रूप से एन्कोड करने के लिए ScikitLearn फ़ंक्शन 'LabelEncoder' का उपयोग कर रहे हैं।

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X_1 = LabelEncoder() 
X[:,1] = labelencoder_X_1.fit_transform(X[:,1]) 
labelencoder_X_2 = LabelEncoder() 
X[:, 2] = labelencoder_X_2.fit_transform(X[:, 2])
X

उत्पादन

उपरोक्त आउटपुट में, देश के नाम 0, 1 और 2 द्वारा प्रतिस्थापित किए जाते हैं; जबकि पुरुष और महिला को 0 और 1 से बदल दिया जाता है।

चरण 5

Labelling Encoded Data

हम उसी का उपयोग करते हैं ScikitLearn पुस्तकालय और एक अन्य समारोह बुलाया OneHotEncoder बस एक डमी चर बनाने कॉलम संख्या पारित करने के लिए।

onehotencoder = OneHotEncoder(categorical features = [1])
X = onehotencoder.fit_transform(X).toarray()
X = X[:, 1:]
X

अब, पहले 2 कॉलम देश का प्रतिनिधित्व करते हैं और 4 वां कॉलम लिंग का प्रतिनिधित्व करता है।

उत्पादन

हम हमेशा अपने डेटा को प्रशिक्षण और परीक्षण भाग में विभाजित करते हैं; हम अपने मॉडल को प्रशिक्षण डेटा पर प्रशिक्षित करते हैं और फिर हम परीक्षण डेटा पर एक मॉडल की सटीकता की जांच करते हैं जो मॉडल की दक्षता का मूल्यांकन करने में मदद करता है।

चरण 6

हम ScikitLearn's का उपयोग कर रहे हैं train_test_splitहमारे डेटा को प्रशिक्षण सेट और परीक्षण सेट में विभाजित करने के लिए कार्य करता है। हम ट्रेन-टू-स्प्लिट अनुपात को 80:20 तक रखते हैं।

#Splitting the dataset into the Training set and the Test Set
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)

कुछ चर हजारों में मान रखते हैं जबकि कुछ दसियों या मानों में होते हैं। हम डेटा को स्केल करते हैं ताकि वे अधिक प्रतिनिधि हों।

चरण 7

इस कोड में, हम प्रशिक्षण डेटा का उपयोग करके फिटिंग और रूपांतरण कर रहे हैं StandardScalerसमारोह। हम अपने स्केलिंग का मानकीकरण करते हैं ताकि हम परीक्षण डेटा को बदलने / स्केल करने के लिए उसी फिटेड विधि का उपयोग करें।

# Feature Scaling
fromsklearn.preprocessing import StandardScaler 
sc = StandardScaler() 
X_train = sc.fit_transform(X_train) 
X_test = sc.transform(X_test)

उत्पादन

डेटा अब ठीक से स्केल किया गया है। अंत में, हम अपने डेटा पूर्व प्रसंस्करण के साथ किया जाता है। अब, हम अपने मॉडल से शुरुआत करेंगे।

चरण 8

हम यहां आवश्यक मॉड्यूल आयात करते हैं। हमें छिपे हुए परतों को जोड़ने के लिए तंत्रिका नेटवर्क और घने मॉड्यूल को शुरू करने के लिए अनुक्रमिक मॉड्यूल की आवश्यकता है।

# Importing the Keras libraries and packages 
import keras 
from keras.models import Sequential 
from keras.layers import Dense

चरण 9

हम मॉडल का नाम क्लासिफायर के रूप में रखेंगे क्योंकि हमारा उद्देश्य ग्राहक मंथन को वर्गीकृत करना है। तब हम इनिशियलाइज़ेशन के लिए अनुक्रमिक मॉड्यूल का उपयोग करते हैं।

#Initializing Neural Network 
classifier = Sequential()

चरण 10

हम घने फ़ंक्शन का उपयोग करके एक-एक करके छिपी हुई परतों को जोड़ते हैं। नीचे दिए गए कोड में, हम कई तर्क देखेंगे।

हमारा पहला पैरामीटर है output_dim। यह इस परत को जोड़ने वाली नोड्स की संख्या है।initस्टोकेस्टिक ग्रेडिएंट डिसेंट का आरंभीकरण है। एक तंत्रिका नेटवर्क में हम प्रत्येक नोड को भार प्रदान करते हैं। आरंभीकरण के समय, वज़न शून्य के पास होना चाहिए और हम समरूप फ़ंक्शन का उपयोग करके वज़न को बेतरतीब ढंग से आरंभ कर सकते हैं। input_dimपैरामीटर केवल पहली परत के लिए आवश्यक है, क्योंकि मॉडल को हमारे इनपुट चर की संख्या नहीं पता है। यहाँ इनपुट चर की कुल संख्या 11. है दूसरी परत में, मॉडल पहले छिपी हुई परत से स्वचालित रूप से इनपुट चर की संख्या जानता है।

इनपुट लेयर और पहली छिपी लेयर को जोड़ने के लिए कोड की निम्न लाइन का परीक्षण करें -

classifier.add(Dense(units = 6, kernel_initializer = 'uniform', 
activation = 'relu', input_dim = 11))

दूसरी छिपी परत को जोड़ने के लिए कोड की निम्नलिखित पंक्ति निष्पादित करें -

classifier.add(Dense(units = 6, kernel_initializer = 'uniform', 
activation = 'relu'))

आउटपुट लेयर को जोड़ने के लिए कोड की निम्नलिखित लाइन का निष्पादन करें -

classifier.add(Dense(units = 1, kernel_initializer = 'uniform', 
activation = 'sigmoid'))

चरण 11

Compiling the ANN

हमने अपने क्लासिफायर में अब तक कई लेयर्स जोड़े हैं। अब हम उनका उपयोग करके संकलन करेंगेcompileतरीका। अंतिम संकलन नियंत्रण में जोड़ा गया तर्क तंत्रिका नेटवर्क को पूरा करता है। इसलिए, हमें इस चरण में सावधान रहने की आवश्यकता है।

यहाँ तर्कों की संक्षिप्त व्याख्या दी गई है।

पहला तर्क है Optimizerयह एक एल्गोरिथ्म है जिसका उपयोग वजन के इष्टतम सेट को खोजने के लिए किया जाता है। इस एल्गोरिथ्म को कहा जाता हैStochastic Gradient Descent (SGD)। यहां हम कई प्रकारों में से एक का उपयोग कर रहे हैं, जिसे 'एडम ऑप्टिमाइज़र' कहा जाता है। SGD नुकसान पर निर्भर करता है, इसलिए हमारा दूसरा पैरामीटर नुकसान है। यदि हमारा आश्रित चर द्विआधारी है, तो हम लॉगरिदमिक लॉस फंक्शन का उपयोग करते हैं‘binary_crossentropy’, और अगर हमारे आश्रित चर के आउटपुट में दो से अधिक श्रेणियां हैं, तो हम उपयोग करते हैं ‘categorical_crossentropy’। हम अपने तंत्रिका नेटवर्क के प्रदर्शन को बेहतर बनाना चाहते हैंaccuracy, इसलिए हम जोड़ते हैं metrics सटीकता के रूप में।

# Compiling Neural Network 
classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

चरण 12

इस चरण में कई कोड निष्पादित किए जाने की आवश्यकता है।

प्रशिक्षण सेट के लिए ANN फिटिंग

अब हम प्रशिक्षण मॉडल पर अपने मॉडल को प्रशिक्षित करते हैं। हम उपयोग करते हैंfitहमारे मॉडल को फिट करने की विधि। हम मॉडल दक्षता में सुधार करने के लिए वजन को भी अनुकूलित करते हैं। इसके लिए वेट अपडेट करना होगा।Batch size टिप्पणियों की संख्या है जिसके बाद हम वज़न को अपडेट करते हैं। Epochपुनरावृत्तियों की कुल संख्या है। बैच आकार और युग का मान परीक्षण और त्रुटि विधि द्वारा चुना जाता है।

classifier.fit(X_train, y_train, batch_size = 10, epochs = 50)

मॉडल का अनुमान लगाना और उसका मूल्यांकन करना

# Predicting the Test set results
y_pred = classifier.predict(X_test)
y_pred = (y_pred > 0.5)

एक नए अवलोकन का पूर्वानुमान

# Predicting a single new observation
"""Our goal is to predict if the customer with the following data will leave the bank:
Geography: Spain
Credit Score: 500
Gender: Female
Age: 40
Tenure: 3
Balance: 50000
Number of Products: 2
Has Credit Card: Yes
Is Active Member: Yes

चरण 13

Predicting the test set result

भविष्यवाणी परिणाम आपको ग्राहक को कंपनी छोड़ने की संभावना देगा। हम उस संभावना को बाइनरी 0 और 1 में बदल देंगे।

# Predicting the Test set results 
y_pred = classifier.predict(X_test) 
y_pred = (y_pred > 0.5)
new_prediction = classifier.predict(sc.transform
(np.array([[0.0, 0, 500, 1, 40, 3, 50000, 2, 1, 1, 40000]])))
new_prediction = (new_prediction > 0.5)

चरण 14

यह अंतिम चरण है जहां हम अपने मॉडल के प्रदर्शन का मूल्यांकन करते हैं। हमारे पास पहले से ही मूल परिणाम हैं और इस प्रकार हम अपने मॉडल की सटीकता की जांच करने के लिए भ्रम मैट्रिक्स का निर्माण कर सकते हैं।

Making the Confusion Matrix

from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)
print (cm)

उत्पादन

loss: 0.3384 acc: 0.8605
[ [1541 54]
[230 175] ]

भ्रम मैट्रिक्स से, हमारे मॉडल की सटीकता की गणना निम्न प्रकार की जा सकती है -

Accuracy = 1541+175/2000=0.858

We achieved 85.8% accuracy, कौन सा अच्छा है।

फ़ॉरवर्ड प्रोपोगेशन एल्गोरिथम

इस खंड में, हम सीखेंगे कि एक सरल तंत्रिका नेटवर्क के लिए आगे प्रसार (भविष्यवाणी) करने के लिए कोड कैसे लिखना है -

प्रत्येक डेटा बिंदु एक ग्राहक है। पहला इनपुट है कि उनके कितने खाते हैं, और दूसरा इनपुट है कि उनके कितने बच्चे हैं। मॉडल भविष्यवाणी करेगा कि उपयोगकर्ता अगले वर्ष में कितने लेनदेन करता है।

इनपुट डेटा को इनपुट डेटा के रूप में पहले से लोड किया जाता है, और वेट एक शब्दकोश में होता है जिसे वेट कहा जाता है। छिपी हुई परत में पहले नोड के लिए वज़न का भार वज़न ['नोड_0'] में है, और छिपी हुई परत में दूसरे नोड के लिए क्रमशः वेट ['नोड_1'] में हैं।

वज़न को आउटपुट नोड में फीड करना वज़न में उपलब्ध है।

रेक्टीफाइड लीनियर एक्टिवेशन फंक्शन

एक "सक्रियण फ़ंक्शन" एक फ़ंक्शन है जो प्रत्येक नोड पर काम करता है। यह नोड के इनपुट को कुछ आउटपुट में बदल देता है।

रेक्टिफाइड लीनियर एक्टीवेशन फंक्शन (जिसे ReLU कहा जाता है ) व्यापक रूप से बहुत उच्च-प्रदर्शन नेटवर्क में उपयोग किया जाता है। यह फ़ंक्शन इनपुट के रूप में एक एकल संख्या लेता है, यदि रिटर्न ऋणात्मक है, तो इनपुट नकारात्मक है, और इनपुट सकारात्मक होने पर आउटपुट के रूप में इनपुट करता है।

यहाँ कुछ उदाहरण हैं -

  • relu (4) = 4
  • relu (-2) = 0

हम रिले () फ़ंक्शन की परिभाषा में भरते हैं

  • हम रिले () के आउटपुट के लिए मूल्य की गणना करने के लिए अधिकतम () फ़ंक्शन का उपयोग करते हैं।
  • हम नोड_0_आउटपुट की गणना करने के लिए relu () फ़ंक्शन को नोड_0_input पर लागू करते हैं।
  • हम नोड_1_input की गणना नोड_1_output की गणना करने के लिए रिले () फ़ंक्शन पर लागू करते हैं।
import numpy as np
input_data = np.array([-1, 2])
weights = {
   'node_0': np.array([3, 3]),
   'node_1': np.array([1, 5]),
   'output': np.array([2, -1])
}
node_0_input = (input_data * weights['node_0']).sum()
node_0_output = np.tanh(node_0_input)
node_1_input = (input_data * weights['node_1']).sum()
node_1_output = np.tanh(node_1_input)
hidden_layer_output = np.array(node_0_output, node_1_output)
output =(hidden_layer_output * weights['output']).sum()
print(output)

def relu(input):
   '''Define your relu activation function here'''
   # Calculate the value for the output of the relu function: output
   output = max(input,0)
      # Return the value just calculated
   return(output)
# Calculate node 0 value: node_0_output
node_0_input = (input_data * weights['node_0']).sum()
node_0_output = relu(node_0_input)

# Calculate node 1 value: node_1_output
node_1_input = (input_data * weights['node_1']).sum()
node_1_output = relu(node_1_input)

# Put node values into array: hidden_layer_outputs
hidden_layer_outputs = np.array([node_0_output, node_1_output])

# Calculate model output (do not apply relu)
odel_output = (hidden_layer_outputs * weights['output']).sum()
print(model_output)# Print model output

उत्पादन

0.9950547536867305
-3

डेटा की कई टिप्पणियों / पंक्तियों के लिए नेटवर्क को लागू करना

इस खंड में, हम सीखेंगे कि एक फ़ंक्शन को कैसे परिभाषित करना है, जिसे predict_with_network () कहा जाता है। यह फ़ंक्शन input_data के रूप में ऊपर दिए गए नेटवर्क से लिए गए कई डेटा टिप्पणियों के लिए भविष्यवाणियां उत्पन्न करेगा। उपरोक्त नेटवर्क में दिए गए वज़न का उपयोग किया जा रहा है। रिले () फ़ंक्शन परिभाषा का भी उपयोग किया जा रहा है।

चलिए हम एक फ़ंक्शन को परिभाषित करते हैं, जिसे फोन किया गया है predict_with_network (), जो दो तर्कों को स्वीकार करता है - input_data_row और वेट - और आउटपुट के रूप में नेटवर्क से एक भविष्यवाणी देता है।

हम प्रत्येक नोड के लिए इनपुट और आउटपुट मानों की गणना करते हैं, उन्हें निम्न रूप में संग्रहीत करते हैं: नोड_0_इनपुट, नोड_0_आउटपुट, नोड_1_इनपुट, और नोड_1_आउटपुट।

नोड के इनपुट मूल्य की गणना करने के लिए, हम संबंधित सरणियों को एक साथ गुणा करते हैं और उनकी राशि की गणना करते हैं।

नोड के आउटपुट मूल्य की गणना करने के लिए, हम नोड के इनपुट मूल्य के लिए रिले () फ़ंक्शन को लागू करते हैं। हम एक 'लूप के लिए' का प्रयोग input_data पर पुनरावृति के लिए करते हैं -

हम input_data - input_data_row की प्रत्येक पंक्ति के लिए भविष्यवाणियों को उत्पन्न करने के लिए अपने predict_with_network () का भी उपयोग करते हैं। हम परिणामों के लिए प्रत्येक भविष्यवाणी को भी जोड़ते हैं।

# Define predict_with_network()
def predict_with_network(input_data_row, weights):
   # Calculate node 0 value
   node_0_input = (input_data_row * weights['node_0']).sum()
   node_0_output = relu(node_0_input)
   
   # Calculate node 1 value
   node_1_input = (input_data_row * weights['node_1']).sum()
   node_1_output = relu(node_1_input)
   
   # Put node values into array: hidden_layer_outputs
   hidden_layer_outputs = np.array([node_0_output, node_1_output])
   
   # Calculate model output
   input_to_final_layer = (hidden_layer_outputs*weights['output']).sum()
   model_output = relu(input_to_final_layer)
# Return model output
   return(model_output)

# Create empty list to store prediction results
results = []
for input_data_row in input_data:
   # Append prediction to results
   results.append(predict_with_network(input_data_row, weights))
print(results)# Print results

उत्पादन

[0, 12]

यहाँ हमने relu फ़ंक्शन का उपयोग किया है जहाँ relu (26) = 26 और relu (-13) = 0 और इतने पर।

डीप मल्टी-लेयर न्यूरल नेटवर्क

यहां हम दो छिपे हुए परतों के साथ एक तंत्रिका नेटवर्क के लिए आगे प्रसार करने के लिए कोड लिख रहे हैं। प्रत्येक छिपी हुई परत में दो नोड होते हैं। इनपुट डेटा को पहले से लोड किया गया हैinput_data। पहली छिपी परत में नोड्स को नोड_0_0 और नोड_0_1 कहा जाता है।

उनका भार क्रमशः भार ['नोड_0_0'] और वजन ['नोड_0_1'] के रूप में होता है।

दूसरी छिपी परत में नोड्स को कहा जाता है node_1_0 and node_1_1। उनके वजन के रूप में पूर्व लोड कर रहे हैंweights['node_1_0'] तथा weights['node_1_1'] क्रमशः।

फिर हम पहले से लोड किए गए वेट का उपयोग करके छिपे हुए नोड्स से एक मॉडल आउटपुट बनाते हैं weights['output']

हम अपने वजन भार ['नोड_0_0'] और दिए गए input_data का उपयोग करके नोड_0_0_पुट की गणना करते हैं। फिर नोड_0_0_आउटपुट प्राप्त करने के लिए रिले () फ़ंक्शन लागू करें।

हम नोड_0_1_input को नोड_0_1_आउटपुट प्राप्त करने के लिए ऊपर की तरह ही करते हैं।

हम अपने वजन भार ['नोड_1_0'] और पहली छिपी परत से आउटपुट - hidden_0_outputs का उपयोग करके नोड_1_0_input की गणना करते हैं। फिर हम नोड_1_0_आउटपुट प्राप्त करने के लिए रिले () फ़ंक्शन को लागू करते हैं।

हम नोड_1_1_input को नोड_1_1_output प्राप्त करने के लिए ऊपर की तरह ही करते हैं।

हम वजन ['आउटपुट'] और दूसरी छुपी हुई परत_1_outputs सरणी से आउटपुट का उपयोग करके model_output की गणना करते हैं। हम इस आउटपुट पर रिले () फ़ंक्शन को लागू नहीं करते हैं।

import numpy as np
input_data = np.array([3, 5])
weights = {
   'node_0_0': np.array([2, 4]),
   'node_0_1': np.array([4, -5]),
   'node_1_0': np.array([-1, 1]),
   'node_1_1': np.array([2, 2]),
   'output': np.array([2, 7])
}
def predict_with_network(input_data):
   # Calculate node 0 in the first hidden layer
   node_0_0_input = (input_data * weights['node_0_0']).sum()
   node_0_0_output = relu(node_0_0_input)
   
   # Calculate node 1 in the first hidden layer
   node_0_1_input = (input_data*weights['node_0_1']).sum()
   node_0_1_output = relu(node_0_1_input)
   
   # Put node values into array: hidden_0_outputs
   hidden_0_outputs = np.array([node_0_0_output, node_0_1_output])
   
   # Calculate node 0 in the second hidden layer
   node_1_0_input = (hidden_0_outputs*weights['node_1_0']).sum()
   node_1_0_output = relu(node_1_0_input)
   
   # Calculate node 1 in the second hidden layer
   node_1_1_input = (hidden_0_outputs*weights['node_1_1']).sum()
   node_1_1_output = relu(node_1_1_input)
   
   # Put node values into array: hidden_1_outputs
   hidden_1_outputs = np.array([node_1_0_output, node_1_1_output])
   
   # Calculate model output: model_output
   model_output = (hidden_1_outputs*weights['output']).sum()
      # Return model_output
   return(model_output)
output = predict_with_network(input_data)
print(output)

उत्पादन

364