PyBrain - Bekerja dengan Kumpulan Data

Set data adalah data masukan yang akan diberikan untuk menguji, memvalidasi, dan melatih jaringan. Jenis kumpulan data yang akan digunakan bergantung pada tugas yang akan kita lakukan dengan Machine Learning. Dalam bab ini, kita akan melihat yang berikut ini -

  • Membuat Set Data
  • Menambahkan Data ke Set Data

Pertama-tama kita akan mempelajari cara membuat Dataset dan menguji dataset dengan input yang diberikan.

Membuat Set Data

Untuk membuat dataset kita perlu menggunakan paket dataset pybrain: pybrain.datasets.

Pybrain mendukung kelas kumpulan data seperti SupervisedDataset, SequentialDataset, ClassificationDataSet. Kami akan memanfaatkanSupervisedDataset , untuk membuat dataset. Dataset yang akan digunakan bergantung pada tugas pembelajaran mesin yang coba diterapkan oleh pengguna. SupervisiDataset adalah yang paling sederhana dan kita akan menggunakan yang sama di sini.

SEBUAH SupervisedDataset datasetmembutuhkan masukan dan target params. Pertimbangkan tabel kebenaran XOR, seperti yang ditunjukkan di bawah ini -

SEBUAH B A XOR B
0 0 0
0 1 1
1 0 1
1 1 0

Input yang diberikan berbentuk array 2 dimensi dan didapatkan 1 output. Jadi disini inputnya menjadi size dan targetnya outputnya yaitu 1. Jadi input yang akan digunakan untuk dataset kita adalah 2,1.

createataset.py

from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
print(sds)

Inilah yang kita dapatkan ketika kita mengeksekusi kode di atas python createataset.py -

C:\pybrain\pybrain\src>python createdataset.py
input: dim(0, 2)
[]
target: dim(0, 1)
[]

Ini menampilkan input ukuran 2 dan target ukuran 1 seperti yang ditunjukkan di atas.

Menambahkan Data ke Set Data

Sekarang mari kita tambahkan data sampel ke dataset.

createataset.py

from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
xorModel = [
   [(0,0), (0,)],
   [(0,1), (1,)],
   [(1,0), (1,)],
   [(1,1), (0,)],
]
for input, target in xorModel:
sds.addSample(input, target)
print("Input is:")
print(sds['input'])
print("\nTarget is:")
print(sds['target'])

Kami telah membuat array XORModel seperti yang ditunjukkan di bawah ini -

xorModel = [
   [(0,0), (0,)],
   [(0,1), (1,)],
   [(1,0), (1,)],
   [(1,1), (0,)],
]

Untuk menambahkan data ke dataset, kami menggunakan metode addSample () yang menerima input dan target.

Untuk menambahkan data ke addSample, kita akan mengulang melalui array xorModel seperti yang ditunjukkan di bawah ini -

for input, target in xorModel:
   sds.addSample(input, target)

Setelah dieksekusi, berikut ini adalah output yang kita dapatkan -

python createataset.py

C:\pybrain\pybrain\src>python createdataset.py
Input is:
[[0. 0.]
[0. 1.]
[1. 0.]
[1. 1.]]
Target is:
[[0.]
[1.]
[1.]
[0.]]

Anda bisa mendapatkan detail input dan target dari dataset yang dibuat hanya dengan menggunakan input dan indeks target seperti yang ditunjukkan di bawah ini -

print(sds['input'])
print(sds[‘target’])