1

使用 Lucene,我想将索引中的文档与其余文档进行比较。我发现一个简单的方法是将文档作为查询提交。问题是我需要将术语作为 OR-Ring 放置,并且最困难的部分是使用term frequency.

我认为如果我修剪文档的所有空格并将它们替换为' OR ', lucene 将解析它并解释它。但是有没有最复杂的方法来处理这个问题?

用它们各自的频率来提升这些术语的最简单方法是什么?

4

1 回答 1

1

看起来您正在尝试重新实现 Lucene 的MoreLikeThis

于 2012-09-21T12:58:46.873 回答