Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
使用 Lucene,我想将索引中的文档与其余文档进行比较。我发现一个简单的方法是将文档作为查询提交。问题是我需要将术语作为 OR-Ring 放置,并且最困难的部分是使用term frequency.
term frequency
我认为如果我修剪文档的所有空格并将它们替换为' OR ', lucene 将解析它并解释它。但是有没有最复杂的方法来处理这个问题?
' OR '
用它们各自的频率来提升这些术语的最简单方法是什么?
看起来您正在尝试重新实现 Lucene 的MoreLikeThis。