PyBrain-네트워크에서 데이터 세트 학습
지금까지 네트워크와 데이터 세트를 만드는 방법을 살펴 보았습니다. 데이터 세트와 네트워크를 함께 사용하려면 트레이너의 도움을 받아야합니다.
아래는 생성 된 네트워크에 데이터 세트를 추가하는 방법을 확인하고 나중에 트레이너를 사용하여 교육하고 테스트하는 작업 예제입니다.
testnetwork.py
from pybrain.tools.shortcuts import buildNetwork
from pybrain.structure import TanhLayer
from pybrain.datasets import SupervisedDataSet
from pybrain.supervised.trainers import BackpropTrainer
# Create a network with two inputs, three hidden, and one output
nn = buildNetwork(2, 3, 1, bias=True, hiddenclass=TanhLayer)
# Create a dataset that matches network input and output sizes:
norgate = SupervisedDataSet(2, 1)
# Create a dataset to be used for testing.
nortrain = SupervisedDataSet(2, 1)
# Add input and target values to dataset
# Values for NOR truth table
norgate.addSample((0, 0), (1,))
norgate.addSample((0, 1), (0,))
norgate.addSample((1, 0), (0,))
norgate.addSample((1, 1), (0,))
# Add input and target values to dataset
# Values for NOR truth table
nortrain.addSample((0, 0), (1,))
nortrain.addSample((0, 1), (0,))
nortrain.addSample((1, 0), (0,))
nortrain.addSample((1, 1), (0,))
#Training the network with dataset norgate.
trainer = BackpropTrainer(nn, norgate)
# will run the loop 1000 times to train it.
for epoch in range(1000):
trainer.train()
trainer.testOnData(dataset=nortrain, verbose = True)
네트워크와 데이터 세트를 테스트하려면 BackpropTrainer가 필요합니다. BackpropTrainer는 시간을 통해 오류를 역 전파하여 감독 된 데이터 세트 (잠재적으로 순차적)에 따라 모듈의 매개 변수를 훈련하는 트레이너입니다.
우리는 SupervisedDataSet라는 2 개의 클래스 데이터 셋을 만들었습니다. 우리는 다음과 같은 NOR 데이터 모델을 사용하고 있습니다.
ㅏ | 비 | A NOR B |
---|---|---|
0 | 0 | 1 |
0 | 1 | 0 |
1 | 0 | 0 |
1 | 1 | 0 |
위의 데이터 모델은 네트워크를 훈련하는 데 사용됩니다.
norgate = SupervisedDataSet(2, 1)
# Add input and target values to dataset
# Values for NOR truth table
norgate.addSample((0, 0), (1,))
norgate.addSample((0, 1), (0,))
norgate.addSample((1, 0), (0,))
norgate.addSample((1, 1), (0,))
다음은 테스트에 사용되는 데이터 세트입니다-
# Create a dataset to be used for testing.
nortrain = SupervisedDataSet(2, 1)
# Add input and target values to dataset
# Values for NOR truth table
norgate.addSample((0, 0), (1,))
norgate.addSample((0, 1), (0,))
norgate.addSample((1, 0), (0,))
norgate.addSample((1, 1), (0,))
트레이너는 다음과 같이 사용됩니다-
#Training the network with dataset norgate.
trainer = BackpropTrainer(nn, norgate)
# will run the loop 1000 times to train it.
for epoch in range(1000):
trainer.train()
데이터 세트를 테스트하기 위해 아래 코드를 사용할 수 있습니다.
trainer.testOnData(dataset=nortrain, verbose = True)
산출
파이썬 testnetwork.py
C:\pybrain\pybrain\src>python testnetwork.py
Testing on data:
('out: ', '[0.887 ]')
('correct:', '[1 ]')
error: 0.00637334
('out: ', '[0.149 ]')
('correct:', '[0 ]')
error: 0.01110338
('out: ', '[0.102 ]')
('correct:', '[0 ]')
error: 0.00522736
('out: ', '[-0.163]')
('correct:', '[0 ]')
error: 0.01328650
('All errors:', [0.006373344564625953, 0.01110338071737218, 0.005227359234093431
, 0.01328649974219942])
('Average error:', 0.008997646064572746)
('Max error:', 0.01328649974219942, 'Median error:', 0.01110338071737218)
출력을 확인하면 테스트 데이터가 제공 한 데이터 세트와 거의 일치하므로 오류는 0.008입니다.
이제 테스트 데이터를 변경하고 평균 오류를 확인하겠습니다. 출력을 아래와 같이 변경했습니다.
다음은 테스트에 사용되는 데이터 세트입니다-
# Create a dataset to be used for testing.
nortrain = SupervisedDataSet(2, 1)
# Add input and target values to dataset
# Values for NOR truth table
norgate.addSample((0, 0), (0,))
norgate.addSample((0, 1), (1,))
norgate.addSample((1, 0), (1,))
norgate.addSample((1, 1), (0,))
이제 테스트 해 보겠습니다.
산출
파이썬 testnework.py
C:\pybrain\pybrain\src>python testnetwork.py
Testing on data:
('out: ', '[0.988 ]')
('correct:', '[0 ]')
error: 0.48842978
('out: ', '[0.027 ]')
('correct:', '[1 ]')
error: 0.47382097
('out: ', '[0.021 ]')
('correct:', '[1 ]')
error: 0.47876379
('out: ', '[-0.04 ]')
('correct:', '[0 ]')
error: 0.00079160
('All errors:', [0.4884297811030845, 0.47382096780393873, 0.47876378995939756, 0
.0007915982149002194])
('Average error:', 0.3604515342703303)
('Max error:', 0.4884297811030845, 'Median error:', 0.47876378995939756)
테스트 데이터가 훈련 된 네트워크와 완전히 일치하지 않음을 나타내는 0.36 오류가 표시됩니다.