2

假设我在 ElasticSearch 中存储这样的文档:

{
    'name':'user name', 
    'age':43, 
    'location':'CA, USA', 
    'bio':'into java, scala, python ..etc.', 
    'tags':['java','scala','python','django','lift']
}

假设我使用 location=CA 进行搜索,如何根据“标签”中的项目数对结果进行排序?

我想在第一页列出标签数量最多的人。

4

1 回答 1

3

您可以对包含标签数量的附加字段进行索引,然后您可以轻松地对结果进行排序。否则,如果您愿意在查询时支付一点性能成本,那么有一个很好的解决方案不需要重新索引您的数据:您可以基于这样的脚本进行排序:

{
    "query" : {
        "match_all" : {}
    },
    "sort" : {
        "_script" : { 
            "script" : "doc['tags'].values.length",
            "type" : "number",
            "order" : "asc"
        }
    }
}

正如您可以从基于脚本的排序部分中看到的那样:

请注意,对于基于单个自定义脚本的排序,建议使用 custom_score 查询,因为基于分数的排序更快。

这意味着最好使用自定义分数查询来影响您的分数,然后按分数排序,如下所示:

{
    "query" : {
        "custom_score" : {
            "query" : {
                "match_all" : {}
            },
            "script" : "_score * doc['tags'].values.length"
        }
    }
}
于 2012-10-04T19:37:24.853 回答