有人可以用更简单的语言解释(或引用参考)来比较 SOLR 和 LUCENE 使用的评分机制。它们有什么区别吗?
我不太擅长 solr/lucene,但我的发现表明它们是不同的。
PS:我只是尝试了一个简单的查询,比如“+Contents:risk”,并没有使用任何过滤器。
有人可以用更简单的语言解释(或引用参考)来比较 SOLR 和 LUCENE 使用的评分机制。它们有什么区别吗?
我不太擅长 solr/lucene,但我的发现表明它们是不同的。
PS:我只是尝试了一个简单的查询,比如“+Contents:risk”,并没有使用任何过滤器。
Lucene 使用向量空间模型中的概念来计算文档的分数。总之,查询和文档可以看作是向量。为了计算特定查询的文档得分,Lucene 计算每个文档的向量与查询向量的距离。在 VSM 中,文档越靠近查询,得分越高。您可以通过查看 Lucene 的Similarity类和 Lucene 的评分文档来了解更多详细信息。
实际公式可以在Similarity javadocs中找到。
以下是所涉及参数的摘要及其含义的简要说明。
Solr 在后台使用 Lucene,默认情况下Solr 使用默认的 Lucene 相似性算法。