Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在处理大量文档,并且有一组预定义的类别/标签(可能是短语),它们将以准确或不准确的形式出现在文档的文本中。我想将每个文档分配给最接近其文本的标签中的一个标签。
请给我一些指示,告诉我我应该怎么做才能解决这个问题。
您可以查看在索引时标记文档的 lucene 搜索引擎。Northernlight 搜索引擎曾经执行过您在其搜索方法中提到的类似任务。您可以查看它的实现以得到一个想法。