PyBrain-데이터 세트 작업
데이터 세트는 네트워크를 테스트, 검증 및 훈련하기 위해 제공되는 입력 데이터입니다. 사용할 데이터 세트 유형은 머신 러닝으로 수행 할 작업에 따라 다릅니다. 이 장에서 우리는 다음을 살펴볼 것입니다-
- 데이터 세트 생성
- 데이터 세트에 데이터 추가
먼저 데이터 세트를 생성하고 주어진 입력으로 데이터 세트를 테스트하는 방법을 배웁니다.
데이터 세트 생성
데이터 세트를 생성하려면 pybrain 데이터 세트 패키지를 사용해야합니다. pybrain.datasets.
Pybrain은 다음과 같은 데이터 세트 클래스를 지원합니다. SupervisedDataset, SequentialDataset, ClassificationDataSet. 우리는 사용할 것입니다SupervisedDataset , to create our dataset. 사용할 데이터 세트는 사용자가 구현하려는 기계 학습 작업에 따라 달라집니다 .SupervisedDataset은 가장 간단한 작업이며 여기에서 동일한 것을 사용할 것입니다.
ㅏ SupervisedDataset dataset매개 변수 입력 및 대상이 필요합니다. 아래와 같이 XOR 진리표를 고려하십시오.
ㅏ | 비 | A XOR B |
---|---|---|
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
주어진 입력은 2 차원 배열과 같으며 1 개의 출력을 얻습니다. 따라서 여기서 입력은 크기가되고 대상은 출력이 1이됩니다. 따라서 데이터 세트에 들어갈 입력은 2,1이됩니다.
createdataset.py
from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
print(sds)
이것은 우리가 위의 코드를 실행할 때 얻는 것입니다 python createdataset.py-
C:\pybrain\pybrain\src>python createdataset.py
input: dim(0, 2)
[]
target: dim(0, 1)
[]
위와 같이 크기 2의 입력과 크기 1의 목표를 표시합니다.
데이터 세트에 데이터 추가
이제 데이터 세트에 샘플 데이터를 추가하겠습니다.
createdataset.py
from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
xorModel = [
[(0,0), (0,)],
[(0,1), (1,)],
[(1,0), (1,)],
[(1,1), (0,)],
]
for input, target in xorModel:
sds.addSample(input, target)
print("Input is:")
print(sds['input'])
print("\nTarget is:")
print(sds['target'])
우리는 아래와 같이 XORModel 배열을 만들었습니다.
xorModel = [
[(0,0), (0,)],
[(0,1), (1,)],
[(1,0), (1,)],
[(1,1), (0,)],
]
데이터 셋에 데이터를 추가하기 위해 입력과 타겟을받는 addSample () 메소드를 사용합니다.
addSample에 데이터를 추가하려면 아래와 같이 xorModel 배열을 반복합니다.
for input, target in xorModel:
sds.addSample(input, target)
실행 후 다음은 우리가 얻는 출력입니다.
파이썬 createdataset.py
C:\pybrain\pybrain\src>python createdataset.py
Input is:
[[0. 0.]
[0. 1.]
[1. 0.]
[1. 1.]]
Target is:
[[0.]
[1.]
[1.]
[0.]]
아래와 같이 입력 및 대상 인덱스를 사용하여 생성 된 데이터 세트에서 입력 및 대상 세부 정보를 얻을 수 있습니다.
print(sds['input'])
print(sds[‘target’])