我想建立一个模型来预测输入信号的未来响应,我的网络架构是 [3, 5, 1]:
- 3个输入,
- 隐藏层中的 5 个神经元,以及
- 输出层中的 1 个神经元。
我的问题是:
- 我们是否应该为每个隐藏层和输出层设置单独的 BIAS?
- 我们是否应该在每一层为 BIAS 分配权重(因为 BIAS 成为我们网络的额外价值并导致网络负担过重)?
- 为什么 BIAS 总是设置为 1?如果 eta 具有不同的值,为什么我们不将 BIAS 设置为不同的值?
- 为什么我们总是对非线性函数使用 log sigmoid 函数,我们可以使用 tanh 吗?