-1

我正在处理大量文档,并且有一组预定义的类别/标签(可能是短语),它们将以准确或不准确的形式出现在文档的文本中。我想将每个文档分配给最接近其文本的标签中的一个标签。

请给我一些指示,告诉我我应该怎么做才能解决这个问题。

4

1 回答 1

-1

您可以查看在索引时标记文档的 lucene 搜索引擎。Northernlight 搜索引擎曾经执行过您在其搜索方法中提到的类似任务。您可以查看它的实现以得到一个想法。

于 2013-03-01T12:23:32.187 回答