-1

是否有任何可以对在线文本或文章进行分类的开源引擎项目。或检查两篇文章的相似性。

例如 1.我有十个不同的文本或文章。然后引擎能够将这篇文章分类到不同的领域,如体育、娱乐、政治。

2.两篇文章描述了同一个事件。引擎能够将它们组合在一起。将它们视为同一篇文章

谢谢你

4

2 回答 2

0

您可以尝试使用Alchemy API。虽然不是开源的,但有一个免费使用层。在您的示例 1 中,他们的主题分类和概念标记可能很有用。在示例 2 的情况下,可以使用任何分类器,如贝叶斯、朴素贝叶斯等,尽管经过培训。Weka也是一个广泛使用的工具。

于 2012-06-20T12:39:08.960 回答
0

看看 Apache Mahout(开源,java)。

于 2012-06-21T09:26:52.587 回答