2

我试图在最短的时间内从 Elasticsearch(版本 - 6.4.2)中获取大量数据记录。为此,我使用多线程在单独的线程中运行每个切片滚动。

示例:我的查询有 3 个切片,因此:

thread 1 - slice id 0
thread 2 - slice id 1
thread 3 - slice id 2

但是在尝试从切片 id 1 和 2 获取结果时,它返回 0 个命中。

我在尝试RestHighLevelClient#search()

public SearchResponse GetResponse(Integer sliceCount, Integer totalSlice, Integer searchSize, String[] identifiers ) throws IOException 
{

    SliceBuilder sliceBuilder = new SliceBuilder(sliceCount, totalSlice);
    SearchSourceBuilder slicedSource = new SearchSourceBuilder().slice(sliceBuilder);
    slicedSource = slicedSource
        .query(QueryBuilders.boolQuery()
        .must(QueryBuilders.termsQuery("_id", identifiers)));
    return client.search(
      new SearchRequest()
        .indices("indexname")
        .types("type")
        .scroll("scrolltime")
        .source(slicedSource)
      );

}
4

1 回答 1

0

您需要重用 SearchSourceBuilder 而不是为每个线程创建它。

请参考:https ://github.com/elastic/elasticsearch/issues/24766

于 2020-06-30T21:53:21.747 回答