2

我需要训练一个神经网络来将一些文本文档分类为一个布尔类(NN 有一个输出带有“是”或“否”值)。
是否有任何算法可以找到最佳输入参数(例如单词、术语、句子和/或单词的频率/重复......)?
如果不能,你能给我一个起点来找到这些参数(我应该如何选择它们)?

谢谢

4

1 回答 1

1

我知道的标准方法是使用单词/术语向量,并使用学习或统计算法为它们分配负分或正分。甚至感知器学习就足够了,你只需要一组好的正面和反面例子。

据我所知,这是所有垃圾邮件过滤器的工作方式。他们工作得很好。

于 2012-01-05T09:10:44.147 回答