我目前正在使用 java 库对离线手写识别进行一些幼稚的实验。我给我的程序一个预先写好的英文句子的图像,并将其分割成单个字符,然后我将其馈送到一个非常天真的构建的神经网络。
我是神经网络的新手,所以我的问题是从哪里开始优化这个网络的超参数。目前它是一个简单的前馈网络,我使用弹性传播进行训练,所以我可以优化的唯一参数是隐藏层的数量,以及每个隐藏层中的神经元数量。我当然可以通过大量但有限数量的组合进行详尽的搜索,但这将非常耗时,而且我敢肯定,在这门艺术方面更有见识的人必须能够指出我的正确方向方向。
我在这里的某个地方发现了一篇文章,该文章指出,对于任何网络来说,一个好的起点通常是只使用一个隐藏层,其神经元数量等于输入和输出层中神经元的平均数量,所以我就是这样目前正在做。
我使用这个模型获得了大约 40-60%(取决于字符)的准确度。