26

这些天我一直在试验神经网络。我遇到了一个关于要使用的激活函数的一般问题。这可能是一个众所周知的事实,但我无法正确理解。我看到的许多示例和论文都在研究分类问题,它们要么使用 sigmoid(在二进制情况下)或 softmax(在多类情况下)作为输出层的激活函数,这很有意义。但我还没有看到回归模型的输出层使用任何激活函数。

所以我的问题是,我们是否选择在回归模型的输出层中不使用任何激活函数,因为我们不希望激活函数限制或限制值。输出值可以是任意数字,大到数千,因此像 sigmoid 到 tanh 这样的激活函数没有意义。还是有其他原因?或者我们实际上可以使用一些针对这类问题的激活函数?

4

3 回答 3

19

对于线性回归类型的问题,您可以简单地创建没有任何激活函数的输出层,因为我们对没有任何转换的数值感兴趣。

更多信息 :

https://machinelearningmastery.com/regression-tutorial-keras-deep-learning-library-python/

用于分类:可以使用 sigmoid、tanh、Softmax 等。

于 2018-04-10T04:29:08.623 回答
14

如果你有一个 Sigmoid 作为你的神经网络输出层的激活函数,你将永远不会得到任何小于 0 和大于 1 的值。

基本上,如果您尝试预测的数据分布在该范围内,您可能会使用 Sigmoid 函数来测试您的预测是否在您的训练集上表现良好。

更一般地说,在预测数据时,您应该提出以最有效的方式表示数据的函数。

因此,如果你的真实数据不能很好地拟合 Sigmoid 函数,你必须考虑任何其他函数(例如,一些多项式函数,或周期函数或任何其他函数或它们的组合),但你也应该始终关心你将如何轻松地构建你的成本函数和评估衍生品。

于 2017-10-11T12:21:40.507 回答
1

只需使用线性激活函数而不限制输出值范围,除非您对此有一些合理的假设。

于 2020-02-13T00:36:10.357 回答