1

我正在使用文本识别,目前我正在使用支持向量机方法。我也想尝试使用神经网络。我阅读了一些关于神经网络如何工作的文件,但理论很重,我不知道它究竟如何适用于我的案例。所以如果有人能帮我说清楚就好了,尤其是神经网络的架构。

  • 目前,在 SVM 中,我有 200 个特征(分为 4 个主要类别),用于识别文本。如果我转向神经网络,有 200 个特征,是否意味着我将在输入层有 200 个中子?
  • 有 200 个特征,这将如何导致神经网络的架构(就数字层(隐藏层)和中子而言)?
  • 在 SVM 中,我有一类分类(基本上是真假)和多类分类(标签),这种差异将如何应用于神经网络的输出层?

我还有一些一般性问题:

  • 什么将有助于确定隐藏层的数量和每个隐藏层内的中子数量?
  • 隐藏层的数量与准确性有关吗?

我是神经网络的新手,所以如果你能以一种不太稳定的方式向我解释,那就太好了。:)
非常感谢。

4

1 回答 1

1

第 1 点 - 它将是 200 个输入神经元,其中每个神经元被输入一个二进制数或浮点数(最好在 -1 到 1 的范围内归一化)。

第 2/4 点 - 大多数问题都通过单个隐藏层解决。当然,如果您从神经网络开始,您应该坚持使用一个隐藏层。我还建议从少于 200 个输入神经元开始,尝试 5 或 10 个。在复杂问题中使用多个隐藏层,例如,第一个隐藏层学习狗、猫、马等宏观特征,下一个隐藏层学习得更好眼睛,鼻子,耳朵等特征。

没有确定隐藏神经元数量的确定程序。问题越复杂,理论上它需要的隐藏神经元就越多。如果你有 10 个输入神经元,从 20 个隐藏神经元开始。如果它不起作用,则其他地方可能有问题。如果它确实有效,您可以减少隐藏神经元的数量,直到它失败。
您也可以从低位开始,然后向上工作。

第 3 点 - 对于真假分类,使用单个输出神经元,并使用 0 或 1 对其进行训练。对于 n 个类别,使用 n 个编码中的 1 个。

第 5 点 - 不。准确度是通过网络的泛化能力来衡量的——即,它如何处理以前从未见过的数据。一般来说,更多的训练数据=更准确。

于 2014-03-06T19:19:46.593 回答