我目前正在实现一个利用 dropout 的神经网络。出现的一个问题是何时停止训练。
通常我会使用提前停止来确定这一点,但在原始dropout 论文中指出“dropout 允许训练更大的网络并消除提前停止的需要”。
如果他们不申请提前停止,他们使用什么停止程序?
我目前正在实现一个利用 dropout 的神经网络。出现的一个问题是何时停止训练。
通常我会使用提前停止来确定这一点,但在原始dropout 论文中指出“dropout 允许训练更大的网络并消除提前停止的需要”。
如果他们不申请提前停止,他们使用什么停止程序?