artificial-intelligence - 反向传播问题

Question

关于如何编写神经网络的反向传播算法，我有几个问题：

我的网络拓扑结构是输入层、隐藏层和输出层。隐藏层和输出层都有 sigmoid 函数。

首先，我应该使用偏见吗？我应该将网络中的偏见连接到哪里？我应该在隐藏层和输出层中每层都放置一个偏置单元吗？输入层呢？
在此链接中，他们将最后一个增量定义为输入-输出，并反向传播增量，如图所示。在实际以前馈方式传播错误之前，他们持有一张表格来放置所有的增量。这是否背离了标准的反向传播算法？
我应该随着时间的推移减少学习因素吗？
万一有人知道，弹性传播是在线还是批量学习技术？

谢谢

编辑：还有一件事。在下图中，d f1(e) / de，假设我使用的是sigmoid函数，是f1(e) * [1- f1(e)]，对吧？

score 3 · Accepted Answer

score 2 · Accepted Answer

您的问题需要更彻底地说明...您需要什么？概括还是记忆？你期待一个复杂的模式匹配数据集，还是一个连续域的输入输出关系？这是我的 0.02 美元：

我建议你留下一个偏置神经元以备不时之需。如果 NN 认为没有必要，训练应该将权重驱动到可以忽略的值。它将连接到前面层中的每个神经元，但不连接到前一层中的任何神经元。
据我所知，这个方程看起来像标准的反向传播。
很难概括您的学习率是否需要随着时间的推移而降低。该行为高度依赖数据。你的学习率越小，你的训练就越稳定。但是，它可能会非常缓慢，尤其是当您像我以前那样使用脚本语言运行它时。
弹性反向传播（或 MATLAB 中的 RProp）应该同时处理在线和批量训练模式。

我想补充一点，如果可能的话，您可能需要考虑替代激活函数。sigmoid 函数并不总是能给出最好的结果......

2 回答 2