10

Java 8 即将发布...在学习 Streams 时,我遇到了一个关于使用一种新方法对字谜进行分组的场景。我面临的问题是我找不到使用 map/reduce 函数对字符串对象进行分组的方法。相反,我必须创建与Aggregate Operations - Reduction中记录的类似方式。

根据文档,我们可以简单地使用:

LIST<T>.stream().collect(Collectors.groupingBy(POJO::GET_METHOD))

所以这Collectors.groupingBy()将根据使用的方法聚合地图的键。然而,这种方法对于包装一个简单的字符串表示来说似乎太麻烦了。

public class AnagramsGrouping {
    static class Word {
        public String original;

        public Word(String word) {
            original = word;
        }

        public String getKey() {
            char[] characters = input.toCharArray();
            Arrays.sort(characters);
            return new String(characters);
        }

        public String toString() {
            return original;
        }
    }

    public static void main(String[] args) {
        List<Word> words = Arrays.asList(new Word("pool"), new Word("loop"),
                new Word("stream"), new Word("arc"), new Word("odor"),
                new Word("car"), new Word("rood"), new Word("meats"),
                new Word("fires"), new Word("fries"), new Word("night"),
                new Word("thing"), new Word("mates"), new Word("teams"));

        Map<String, List<Word>> anagrams = words.stream().collect(
                Collectors.groupingBy(Word::getKey));

        System.out.println(anagrams);
    }
}

这将打印以下内容:

{door=[odor, rood], acr=[arc, car], ghint=[night, thing],
 aemrst=[stream], efirs=[fires, fries], loop=[pool, loop],
 aemst=[meats, mates, teams]}

相反,我正在寻找一种更简单、更直接的解决方案,它使用新的 map/reduce 函数将结果累积到类似的界面Map<String, List<String>中。基于How to convert List to Map,我有以下内容:

List<String> words2 = Arrays.asList("pool", "loop", "stream", "arc",
        "odor", "car", "rood", "meats", "fires", "fries",
        "night", "thing", "mates", "teams");

words2.stream().collect(Collectors.toMap(w -> sortChars(w), w -> w));

但是这段代码会产生一个键冲突,因为它是一个 1-1 的映射。

Exception in thread "main" java.lang.IllegalStateException: Duplicate key pool

这是有道理的......有没有办法将它们分组到与第一个解决方案类似的输出中groupingBy,但不使用包装值的POJO?

4

2 回答 2

19

单参数groupingBy收集器正是您想要做的。它对其输入进行分类,您已经使用过sortChars(或getKey在前面的示例中)。归类在同一键下的每个流值都被放入一个列表中,该列表是映射的值。因此我们有:

Map<String, List<String>> anagrams =
    words2.stream().collect(Collectors.groupingBy(w -> sortChars(w)));

给出输出

{door=[odor, rood], acr=[arc, car], ghint=[night, thing], aemrst=[stream],
efirs=[fires, fries], loop=[pool, loop], aemst=[meats, mates, teams]}

您还可以使用方法参考:

Map<String, List<String>> anagrams =
    words2.stream().collect(Collectors.groupingBy(GroupingAnagrams::sortChars));

如果您想对这些值做一些事情而不是建立一个列表,请使用多参数重载groupingBy和“下游”收集器。例如,要计算单词而不是建立列表,请执行以下操作:

Map<String, Long> anagrams =
    words2.stream().collect(
        Collectors.groupingBy(GroupingAnagrams::sortChars, Collectors.counting()));

这导致:

{door=2, acr=2, ghint=2, aemrst=1, efirs=2, loop=2, aemst=3}

编辑:

如果不清楚,sortChars它只是一个静态函数,它执行与getKey第一个示例中类似的功能,但从字符串到字符串:

public static String sortChars(String input) {
    char[] characters = input.toCharArray();
    Arrays.sort(characters);
    return new String(characters);
}
于 2014-02-24T04:40:58.390 回答
0

您可以使用toMap带有四个参数的方法并分别指定:键类型、值类型、具有相同键的值的合并函数以及Map将插入结果的特定实现。

在这种情况下,您可以选择:

  • key——int[]单词的字符码点排序数组;
  • value - List<String>- 字谜列表;
  • 合并功能 - 两个列表合二为一;
  • map -TreeMap带有比较两个int[]数组的比较器。
List<String> words = List.of("pool", "loop", "stream", "arc", "odor", "car",
        "rood", "meats", "fires", "fries", "night", "thing", "mates", "teams");
Map<int[], List<String>> anagrams = words.stream()
        .collect(Collectors.toMap(
                // key - a sorted array of character code points
                word -> word.codePoints().sorted().toArray(),
                // value - a list of anagrams
                word -> new ArrayList<>(List.of(word)),
                // merge elements of two lists
                (list1, list2) -> {
                    list1.addAll(list2);
                    return list1;
                },
                // comparator that compares two int[] arrays
                () -> new TreeMap<>(Arrays::compare)));
// output
anagrams.forEach((k, v) -> System.out.println(v.get(0) + "=" + v));

输出:

arc=[arc, car]
stream=[stream]
meats=[meats, mates, teams]
odor=[odor, rood]
fires=[fires, fries]
night=[night, thing]
pool=[pool, loop]

另请参阅:你如何检查一个单词是否有一个回文的字谜?

于 2021-04-14T22:33:03.220 回答