solr - 在 Solr 中的查询时忽略 tf/idf

Question

我正在尝试根据字段值提升特定文档。它通常工作正常，但一些文档返回更高的分数，即使它们具有较小的提升值。

在使用请求参数调试查询后，debugQuery=on我注意到该idf函数为特定文档返回了更高的分数，这影响了整体分数。

有没有办法在查询时忽略 tf/idf 评分？

score 9 · Accepted Answer

您需要创建一个自定义的Similarity来覆盖 tf 和 idf 方法，并使用它来代替 DefaultSimilarity。

就像是：

class CustomSimilarity extends DefaultSimilarity {

    @Override
    public float tf(float freq) {
        return 1.0;
    }

    @Override
    public float tf(int freq) {
        return 1.0;
    }

    @Override
    // Note the signature of this method may now take longs:
    //   public float idf(long docFreq, long numDocs)
    public float idf(int docFreq, int numDocs) {
        return 1.0;
    }
}

将其设置为在您的 schema.xml 中使用该相似性：

<similarity class="myorg.mypackage.CustomSimilarity"/>

solr - 在 Solr 中的查询时忽略 tf/idf

1 回答 1

Related

Reference