python - 使用 pybrain 进行神经网络回归

Question

我需要用前馈网络解决回归问题，我一直在尝试使用 PyBrain 来解决这个问题。由于 pybrain 的参考文献中没有回归示例，因此我尝试将其分类示例改为回归，但没有成功（分类示例可在此处找到：http: //pybrain.org/docs/tutorial/fnn.html）。以下是我的代码：

第一个函数将我的 numpy 数组形式的数据转换为 pybrain SupervisedDataset。我使用 SupervisedDataset 是因为根据 pybrain 的参考，它是问题回归时使用的数据集。参数是一个包含特征向量（数据）及其预期输出（值）的数组：

def convertDataNeuralNetwork(data, values):

fulldata = SupervisedDataSet(data.shape[1], 1)

for d, v in zip(data, values):

    fulldata.addSample(d, v)    

return fulldata

接下来是运行回归的函数。train_data 和 train_values 是训练特征向量及其预期输出，test_data 和 test_values 是测试特征向量及其预期输出：

regressionTrain = convertDataNeuralNetwork(train_data, train_values)

regressionTest = convertDataNeuralNetwork(test_data, test_values)

fnn = FeedForwardNetwork()

inLayer = LinearLayer(regressionTrain.indim)
hiddenLayer = LinearLayer(5)
outLayer = GaussianLayer(regressionTrain.outdim)

fnn.addInputModule(inLayer)
fnn.addModule(hiddenLayer)
fnn.addOutputModule(outLayer)

in_to_hidden = FullConnection(inLayer, hiddenLayer)
hidden_to_out = FullConnection(hiddenLayer, outLayer)

fnn.addConnection(in_to_hidden)
fnn.addConnection(hidden_to_out)

fnn.sortModules()

trainer = BackpropTrainer(fnn, dataset=regressionTrain, momentum=0.1, verbose=True, weightdecay=0.01)

for i in range(10):

    trainer.trainEpochs(5)

    res = trainer.testOnClassData(dataset=regressionTest )

    print res

当我打印 res 时，它的所有值都是 0。我尝试使用 buildNetwork 函数作为构建网络的快捷方式，但效果不佳。我还尝试了隐藏层中不同类型的层和不同数量的节点，但没有运气。

有人知道我做错了什么吗？此外，一些 pybrain 回归示例真的很有帮助！我看的时候找不到。

提前致谢

score 5 · Accepted Answer

pybrain.tools.neuralnets.NNregression是一种工具

学习用可选的在线进度图以数字方式预测一组数据的目标。

所以它似乎非常适合为您的回归任务构建神经网络。

score 4 · Accepted Answer

正如 Ben Allison 最初指出的那样，为了使网络能够逼近任意值（即不一定在范围内0..1），重要的是不要在最后一层使用具有有限输出范围的激活函数。例如，线性激活函数应该可以很好地工作。

这是一个从 pybrain 的基本元素构建的简单回归示例：

#----------
# build the dataset
#----------
from pybrain.datasets import SupervisedDataSet
import numpy, math

xvalues = numpy.linspace(0,2 * math.pi, 1001)
yvalues = 5 * numpy.sin(xvalues)

ds = SupervisedDataSet(1, 1)
for x, y in zip(xvalues, yvalues):
    ds.addSample((x,), (y,))

#----------
# build the network
#----------
from pybrain.structure import SigmoidLayer, LinearLayer
from pybrain.tools.shortcuts import buildNetwork

net = buildNetwork(1,
                   100, # number of hidden units
                   1,
                   bias = True,
                   hiddenclass = SigmoidLayer,
                   outclass = LinearLayer
                   )
#----------
# train
#----------
from pybrain.supervised.trainers import BackpropTrainer
trainer = BackpropTrainer(net, ds, verbose = True)
trainer.trainUntilConvergence(maxEpochs = 100)

#----------
# evaluate
#----------
import pylab
# neural net approximation
pylab.plot(xvalues,
           [ net.activate([x]) for x in xvalues ], linewidth = 2,
           color = 'blue', label = 'NN output')

# target function
pylab.plot(xvalues,
           yvalues, linewidth = 2, color = 'red', label = 'target')

pylab.grid()
pylab.legend()
pylab.show()

附带说明（因为在您的代码示例中，您有一个带有线性激活函数的隐藏层）：在任何隐藏层中，线性函数都没有用，因为：

该层输入端的权重形成线性变换
激活函数是线性的
该层输出端的权重形成线性变换

可以将其简化为一个单一的线性变换，即它们对应的层也可以在不减少可以近似的函数集的情况下被消除。神经网络的一个重要点是激活函数在隐藏层中是非线性的。

score 4 · Accepted Answer

我认为这里可能发生了几件事。

首先，我建议使用与您使用的不同的层激活配置。特别是，对于初学者，尝试对网络中的隐藏层使用 sigmoidal 非线性，对输出层使用线性激活。这是迄今为止典型受监督网络最常见的设置，应该可以帮助您入门。

引起我注意的第二件事是weightDecay您的训练器中的参数值相对较大（尽管“相对较大”的构成取决于输入和输出值的自然比例）。我会为初学者删除该参数，或将其值设置为 0。权重衰减是一个正则化器，有助于防止您的网络过度拟合，但如果您将该参数的值增加太多，您的网络权重将全部变为 0很快（然后你的网络梯度将基本上为 0，因此学习将停止）。仅weightDecay当您在验证数据集上的性能在训练期间开始下降时才设置为非零值。

score 0 · Accepted Answer

正如 Andre Holzner 解释的，隐藏层应该是非线性的。Andre 的代码示例很棒，但是当您拥有更多功能而没有那么多数据时，它就无法正常工作。在这种情况下，由于隐藏层很大，我们得到了很好的近似值，但是当您处理更复杂的数据时，仅输出层中的线性函数是不够的，您应该对特征进行归一化并且目标在 [0..1] 范围内.

python - 使用 pybrain 进行神经网络回归

4 回答 4

Related

Reference