我目前正在研究 MNIST 手写数字分类。
我构建了一个具有以下结构的前馈网络:
- 输入: 28x28 = 784 个输入
- 隐藏层:具有 1000 个神经元的单个隐藏层
- 输出层: 10 个神经元
所有的神经元都具有Sigmoid激活函数。
报告的类是对应于具有最大输出值的输出神经元的类
我的问题是:
- 创建具有多个输出的单个网络是一种好方法吗?即我应该为每个数字创建一个单独的网络吗?
我问一下,因为目前网络卡在 ~75% 的成功率上。由于实际上“10 个分类器”共享隐藏层的相同神经元——我不确定——它是否会降低网络学习能力?
** 编辑: **
由于其他人可能会参考这个线程,我想说实话并更新 75% 的成功率是在大约 1500 个 epoch 之后。现在我经过了近 3000 个 epoch 并且成功率约为 85% - 所以效果很好