我正在第一次真正深入研究神经网络,我正在尝试构建经典的“数字识别网络”,而无需任何外部数据库。经过一些初步测试后,我遇到了我的网络保持所有权重非常低的问题,因此输出几乎为零。我明白为什么会发生这种情况(每次程序在 10 个输出中有 9 个正确!)但显然这是我需要阻止发生的事情。
有人对我如何解决这个问题有提示吗?我正在为前馈神经网络使用 sigmoid 激活函数和交叉熵成本函数,我想知道是否有更好的选择可以让程序更显着地考虑正确数字中的错误。
我正在第一次真正深入研究神经网络,我正在尝试构建经典的“数字识别网络”,而无需任何外部数据库。经过一些初步测试后,我遇到了我的网络保持所有权重非常低的问题,因此输出几乎为零。我明白为什么会发生这种情况(每次程序在 10 个输出中有 9 个正确!)但显然这是我需要阻止发生的事情。
有人对我如何解决这个问题有提示吗?我正在为前馈神经网络使用 sigmoid 激活函数和交叉熵成本函数,我想知道是否有更好的选择可以让程序更显着地考虑正确数字中的错误。