PyBrain - डेटासेट के साथ काम करना
डेटासेट एक इनपुट डेटा है जिसे नेटवर्क, परीक्षण और मान्य करने के लिए दिया जाना है। उपयोग किए जाने वाले डेटासेट का प्रकार उन कार्यों पर निर्भर करता है जो हम मशीन लर्निंग के साथ करने जा रहे हैं। इस अध्याय में, हम निम्नलिखित पर एक नज़र डालने जा रहे हैं -
- डेटासेट बनाना
- डेटासेट में जोड़ना
हम पहले सीखेंगे कि डेटासेट कैसे बनाएं और दिए गए इनपुट से डेटासेट का परीक्षण करें।
डेटासेट बनाना
एक डेटासेट बनाने के लिए हमें pybrain डेटासेट पैकेज का उपयोग करना होगा: pybrain.datasets।
Pybrain डेटासेट कक्षाओं की तरह समर्थन करता है SupervisedDataset, अनुक्रमिकदात्से, वर्गीकरणडासैटसेट। हम उपयोग करने जा रहे हैंSupervisedDataset , हमारे डाटासेट बनाने के लिए। उपयोग किए जाने वाले डेटासेट मशीन सीखने के कार्य पर निर्भर करता है जिसे उपयोगकर्ता कार्यान्वित करने की कोशिश कर रहा है। SupervisedDataset सबसे सरल है और हम यहां पर उसी का उपयोग करने जा रहे हैं।
ए SupervisedDataset datasetपरमेस इनपुट और लक्ष्य की जरूरत है। एक XOR सत्य तालिका पर विचार करें, जैसा कि नीचे दिखाया गया है -
ए | ख | A XOR B |
---|---|---|
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
जो इनपुट दिए गए हैं, वे 2-आयामी सरणी की तरह हैं और हमें 1 आउटपुट मिलता है। तो यहाँ इनपुट आकार बन जाता है और इसे लक्ष्य बनाता है जो आउटपुट है। 1. तो हमारे डेटासेट के लिए जाने वाले इनपुट 2,1 होंगे।
createdataset.py
from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
print(sds)
यह तब होता है जब हम कोड पाइथन क्रिएटसैटमॉक से ऊपर निष्पादित करते हैं -
C:\pybrain\pybrain\src>python createdataset.py
input: dim(0, 2)
[]
target: dim(0, 1)
[]
यह आकार 2 के इनपुट और आकार 1 के लक्ष्य को ऊपर दिखाए गए अनुसार प्रदर्शित करता है।
डेटासेट में जोड़ना
अब हम डेटासेट में डेटा को जोड़ते हैं।
createdataset.py
from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
xorModel = [
[(0,0), (0,)],
[(0,1), (1,)],
[(1,0), (1,)],
[(1,1), (0,)],
]
for input, target in xorModel:
sds.addSample(input, target)
print("Input is:")
print(sds['input'])
print("\nTarget is:")
print(sds['target'])
हमने एक XORModel सरणी बनाई है जैसा कि नीचे दिखाया गया है -
xorModel = [
[(0,0), (0,)],
[(0,1), (1,)],
[(1,0), (1,)],
[(1,1), (0,)],
]
डेटासेट में डेटा जोड़ने के लिए, हम addSample () पद्धति का उपयोग कर रहे हैं जो इनपुट और लक्ष्य में लेता है।
AddSample में डेटा जोड़ने के लिए, हम नीचे दिखाए अनुसार xorModel ऐरे से लूप करेंगे -
for input, target in xorModel:
sds.addSample(input, target)
निष्पादित करने के बाद, निम्नलिखित आउटपुट हमें मिलता है -
python createataset.py
C:\pybrain\pybrain\src>python createdataset.py
Input is:
[[0. 0.]
[0. 1.]
[1. 0.]
[1. 1.]]
Target is:
[[0.]
[1.]
[1.]
[0.]]
आप नीचे दिखाए गए इनपुट और लक्ष्य सूचकांक का उपयोग करके बनाए गए डेटासेट से इनपुट और लक्ष्य विवरण प्राप्त कर सकते हैं -
print(sds['input'])
print(sds[‘target’])