这些天我一直在试验神经网络。我遇到了一个关于要使用的激活函数的一般问题。这可能是一个众所周知的事实,但我无法正确理解。我看到的许多示例和论文都在研究分类问题,它们要么使用 sigmoid(在二进制情况下)或 softmax(在多类情况下)作为输出层的激活函数,这很有意义。但我还没有看到回归模型的输出层使用任何激活函数。
所以我的问题是,我们是否选择在回归模型的输出层中不使用任何激活函数,因为我们不希望激活函数限制或限制值。输出值可以是任意数字,大到数千,因此像 sigmoid 到 tanh 这样的激活函数没有意义。还是有其他原因?或者我们实际上可以使用一些针对这类问题的激活函数?