2

目前,我正面临以下数据集。我的目标是通过前两列获得 Column4 组的最新总和。

// Column5 = version
new Foo(1, "bbb", "cccc", 111, 0)
new Foo(1, "bbb", "cccc", 234, 1) // latest
new Foo(1, "bbb", "dddd", 111, 0)
new Foo(1, "bbb", "dddd", 112, 1)
new Foo(1, "bbb", "dddd", 113, 2)
new Foo(1, "bbb", "dddd", 114, 3) // latest
new Foo(1, "xxx", "cccc", 111, 0) // latest
new Foo(2, "xxx", "yyyy", 0, 0)
new Foo(2, "xxx", "yyyy", 1, 1)   // latest
...

我试过的是

// key: Column1, key: Column2, value: latest sum of Column4
Map<Long, Map<String, Integer>> fooMap = fooList.stream().collect(
    Collectors.groupingBy(Foo::getColumn1, Collectors.groupingBy(Foo::getColumn2,
            Collectors.collectingAndThen(????))));

无论????我尝试过的部分Collectors.groupingBy,,Collectors.maxByCollectors.summingInt

但这总是错误的。

我理想的地图应该是这样的:

1->bbb->348, 1->xxx->111, 2->xxx->1.

请帮助让我知道是否需要任何补品。谢谢。

4

2 回答 2

2

您可以通过以下方式获得它:

    Map<Long, Map<String, Integer>> fooMap = fooList.stream().collect(
            groupingBy(Foo::getColumn1,
                    groupingBy(Foo::getColumn2,
                            collectingAndThen(
                                    groupingBy(Foo::getColumn3,
                                            collectingAndThen(
                                                    maxBy(comparing(Foo::getVersion)),
                                                    Optional::get
                                            )),
                                    m -> m.values().stream().mapToInt(Foo::getColumn4).sum()
                            )
                    )
            ));

首先按 column1 和 column2 进行分组,然后我们使用 acollectingAndThen进行按 column3 的分组,因为我们要对其进行后期处理。

按 column3 分组,我们想按版本获取最大值,我们使用 another collectingAndThen,因为 maxBy 创建 and Optional,所以我们应用 anOptional::Get来获取 aMap<String, Foo>而不是 a Map<String, Optional<Foo>>

后期处理是将地图中 Foo 的所有 column4 相加,即具有最大版本的列。

于 2021-01-15T15:16:50.020 回答
2

将模型表示为简化为:

record Foo(Long one, String two, String three, int value, int version) {
}

record Result(Long one, String two, int totalValue) {
}

您可以从按前三个属性分组并将值映射到选择最大版本的标识开始。

Map<List<Object>, Foo> groupedMaxVersion = fooList.stream()
        .collect(Collectors.toMap(foo -> Arrays.asList(foo.one(), foo.two(), foo.three()),
                foo -> foo, BinaryOperator.maxBy(Comparator.comparing(Foo::version))));

随后可以根据第 4 列中的值对下游求和:

Map<List<Object>, Integer> resultMapping = groupedMaxVersion.entrySet().stream()
        .collect(Collectors.groupingBy(e -> Arrays.asList(e.getKey().get(0), e.getKey().get(1)),
                Collectors.summingInt(e -> e.getValue().value())));

此外,您只需根据需要将其构建到结果数据结构中

resultMapping.entrySet().stream()
                .map(e -> new Result((Long) e.getKey().get(0), (String) e.getKey().get(1), e.getValue()))
                .collect(Collectors.toList()); 
于 2021-01-15T17:24:11.227 回答