2

嘿,我有一个任务要执行,基本上就是以某种方式检索与某个领域有关的 powerpoint 演示文稿或 pdf 文档。假设我想检索与生物信息学领域有关的 ppt 和 pdf 讲义。我想知道这项任务是否可以通过调整使用由神经网络训练的神经机器人的方法来完成?在我进一步实施之前,只是想确认这种方法并非完全错误。

如果有人想知道为什么在这种情况下需要神经网络或任何学习算法,这就是我的计划(这可能是错误的,或者可能有更简单的方法来实现这一点,所以请随时纠正我):

我生成由神经网络训练的神经机器人(尚不确定这种训练是如何发生的,我假设通过使用某些 ppt 和 pdf 文件的样本训练集进行监督学习),然后这些机器人检索与他们通过学习相似的页面他们的训练。

那么上述方法是完成这项任务的正确方法吗?

4

1 回答 1

8

神经网络很复杂。看起来你有一个通用的文档分类问题。最简单的起点是使用某种带有词袋特征的朴素贝叶斯模型。我将从那里采取的下一步是在同一特征集上使用线性 SVM 或逻辑回归。如果在尝试了更简单的事情之后仍然没有得到想要的性能,那么也许可以继续尝试使用神经网络。

就像你不会说的那样,我想写一个电子邮件服务器,我将从写一个操作系统开始,在更简单的事情失败之前,我倾向于对使用神经网络持谨慎态度。

于 2012-05-22T00:11:40.007 回答