1

我开始从事一个项目,在该项目中我必须用关键字标记文档,如果您手动操作(特别是如果您有数千个文档),这真的很难而且很耗时。所以我打算自动化这个过程(知道结果不会完美,但至少它会给你一些建议的标签)。在最新的 Firefox 版本中,他们实现了这样的系统(当您为页面添加书签时,它会建议您一些标签)。

雅虎术语提取服务也是一个很好的例子

因此,如果任何机构可以帮助我解决这个问题,我将非常感谢您的帮助。或者,如果有人知道 Firefox 标记系统,那么一点帮助会很棒。

4

1 回答 1

1

统计算法会起作用吗?也许是贝叶斯?我知道它们用于垃圾邮件过滤,也许您可​​以调整贝叶斯过滤器以满足您的需求。

至少,你可以推荐一些经常使用但在英语中不常用的词(他、她、我、和、它、那么、或等……)

于 2009-08-09T19:59:19.633 回答