9

我是 ElasticSearch 和 Couchbase 的新手。我正在构建一个示例 Java 应用程序以了解有关 ElasticSearch 和 Couchbase 的更多信息。

阅读ElasticSearch Java API,过滤器更适合用于不需要按分数排序和缓存的情况。我还没有弄清楚如何使用 FilterBuilders 并且有以下问题:

  • 可以FilterBuilders单独使用搜索吗?
  • 或者它们是否总是必须与 a 一起使用Query?(如果属实,有人可以举个例子吗?)
  • 浏览文档,如果我想根据字段值执行搜索并想使用 FilterBuilders,我该如何完成?(使用AndFilterBuilderor TermFilterBuilderor InFilterBuilder?我不清楚它们之间的区别。)

对于第三个问题,我实际上使用查询和过滤器进行了搜索,如下所示。当我尝试使用FilterBuilders. 我不确定我做错了什么。

任何示例都会有所帮助。我在浏览文档时遇到了困难,我发现这些文档很少,甚至搜索导致各种不可靠的用户论坛。

private void processQuery() {
        SearchRequestBuilder srb = getSearchRequestBuilder(BUCKET);
        QueryBuilder qb = QueryBuilders.fieldQuery("doc.address.state", "TX");
        srb.setQuery(qb);

        SearchResponse resp = srb.execute().actionGet();
        System.out.println("response :" + resp);
    }

private void searchWithFilters(){
        SearchRequestBuilder srb = getSearchRequestBuilder(BUCKET);
        srb.setFilter(FilterBuilders.termFilter("doc.address.state", "tx"));
        //AndFilterBuilder andFb = FilterBuilders.andFilter();
        //andFb.add(FilterBuilders.termFilter("doc.address.state", "TX")); 
        //srb.setFilter(andFb);
        SearchResponse resp = srb.execute().actionGet();
        System.out.println("response :" + resp);
    }

- -更新--

正如答案中所建议的,更改为小写“tx”有效。这个问题解决了。我还有以下问题:

  • 在什么情况下,过滤器与查询一起使用?这将用于什么目的?
  • 和之间InFilter的区别。任何插图都会有所帮助。TermFilterMatchAllFilter
4

3 回答 3

11

是的,您应该使用过滤器在执行查询时将文档排除在外。过滤器更快,因为它们不涉及任何评分,并且也可缓存。

也就是说,很明显您必须使用带有搜索 api的过滤器,它会执行查询并接受可选的过滤器。如果您只有一个过滤器,您可以将match_all查询与您的过滤器一起使用。过滤器可以是简单的过滤器,也可以是复合过滤器,以便将多个过滤器组合在一起。

关于Java API,使用的名称是可用过滤器的名称,没有太大区别。例如,看看这个搜索示例。在您的代码中,我看不到您setFilterSearchRequestBuilder对象上做了什么。您似乎也不需要 and 过滤器,因为您使用的是单个过滤器。此外,您可能正在使用默认映射进行索引,因此术语“TX”是小写的。这就是为什么当您使用术语过滤器进行搜索时找不到任何匹配项的原因。尝试搜索小写的“tx”。

如果您想在索引时保持“TX”术语原样,您可以更改映射,可能将字段设置为not_analyzed好像它应该只是一个标记。否则,您可以更改过滤器,您可能希望查看已分析的查询,以便您的查询将以与内容被索引相同的方式进行分析。

查看查询 DSL 文档以获取有关查询和过滤器的更多信息:

  • MatchAllFilter: 匹配你所有的文档,我想说的没那么有用
  • TermFilter:过滤具有包含术语的字段的文档(未分析)
  • AndFilter: 复合过滤器用于放入和两个或多个过滤器

不知道您的意思InFilterBuilder,找不到任何具有此名称的过滤器。

查询通常包含用户通过文本搜索框输入的内容。过滤器是细化搜索的更多方式,例如单击构面条目。这就是为什么您仍然需要查询加上一个或多个过滤器的原因。

于 2013-05-10T18:14:09.150 回答
6

附加到@javanna 所说的内容:

可以通过多种方式定义过滤器这一事实可能会造成很多混乱:

你可能会问有什么不同。事实上,你可以用两种方式构建完全相同的逻辑。

不同之处在于查询对结果集以及您定义的任何方面都进行了操作。而过滤器(当独立定义时)仅在结果集上运行,而不在您可能定义的任何方面上运行(在此处解释:http ://www.elasticsearch.org/guide/reference/api/search/filter/ )

于 2013-05-11T14:19:02.320 回答
2

要添加到其他答案,InFilter 仅与 FilterBuilders 一起使用。定义是, InFilter:基于与其中任何一个匹配的多个术语的字段过滤器。

查询 Java API 使用 FilterBuilders,它是过滤器构建器的工厂,可以从 Java 代码动态创建查询。我们使用表单来执行此操作,并根据用户选择的复选框、选项和下拉菜单来构建查询。

这是 FilterBuilders 的一些示例代码,该链接中有一个使用 InFilter 的片段,如下所示:

FilterBuilder filterBuilder;
    User user = (User) auth.getPrincipal();
    if (user.getGroups() != null && !user.getGroups().isEmpty()) {
        filterBuilder = FilterBuilders.boolFilter()
                .should(FilterBuilders.nestedFilter("userRoles", FilterBuilders.termFilter("userRoles.key", auth.getName())))
                .should(FilterBuilders.nestedFilter("groupRoles", FilterBuilders.inFilter("groupRoles.key", user.getGroups().toArray())));
    } else {
        filterBuilder = FilterBuilders.nestedFilter("userRoles", FilterBuilders.termFilter("userRoles.key", auth.getName()));
    }
    ...
于 2016-03-04T18:39:28.080 回答