2

场景是在多个字段值上提升文档:

我有一个Category包含值的字段“”-“ News”、“ image”、“ video”、“ audio”。

现在基于上面提到的字段值,我想给它们一些提升(优先级),例如“ News”获得最高优先级,其次是“ video” ,然后是“”audio等等。

与类别类似,还有更多字段,需要根据字段值以相同的方式进行提升。

前任。提升规则可以是,

Category=  News^1000
Category=  Image^900
Premium_Contents = True^200
Sponsored = True^300

... 很快

所以我遇到了一个解决方案Reference。我正在尝试找出计算我的搜索相关性结果集的最佳方法。

4

1 回答 1

3

是的,我认为您的链接是一个合理的想法。这是我们使用的,因为我们要强制执行所有搜索的提升,并且我们不会经常更改逻辑,例如在您的情况下:-

<requestHandler name="/select" class="solr.SearchHandler">
    <lst name="defaults">
        <str name="defType">edismax</str>
        <str name="boost">product(
                    map(query($type1query),0,0,1,$type1boost),
                    map(query($type2query),0,0,1,$type2boost))</str>
            <str name="type1query">Category:"News"</str>
            <double name="type1boost">1000.0</double>
            <str name="type2query">Category:"Image"</str>
            <double name="type2boost">900.0</double>
    </lst>
</requestHandler>

在这种情况下,查询函数返回特定查询的分数。那是在类别中寻找新闻、图像等的匹配项。

map 函数具有以下签名: map(x,min,max,target,value) 将函数 x 的任何值映射到目标中的 min 和 max 范围内。min,max,target,value 是常量。如果它不在最小值和最大值之间,它会输出字段的值(或“值”)。换句话说,如果查询的结果是正值(有匹配),它将输出提升(1000,900 等)。您需要使用提升值,因为它们可能会压倒您拥有的任何其他排名逻辑。例如,您可能会首先在新闻排名上获得较差的匹配,而视频上的匹配则更好。

您可以使用这些提升创建单独的请求处理程序,以便您可以绕过它们进行其他搜索。显然,如果您进行任何更改,您必须更改 solrconfig 并重新启动 Solr,这可能是一个问题。

否则请查看 bq(增强查询)参数。

bq=Category:News^1000.0+Category:Image^900...

它实际上在幕后产生了这样的东西

boost(+*:* (Category:News^1000 + Category:Image^900))

这意味着提升是在您的搜索代码中完成的,既美观又灵活。我个人更喜欢这种工作方式。

于 2016-08-09T09:35:11.590 回答