Java Stream API groupingBy()介绍

18-09-21 banq
         

groupingBy()是Stream API中最强大的收集器Collector之一,提供与SQL的GROUP BY子句类似的功能。

使用形式如下:
.collect(groupingBy(...));


需要指定一个属性才能使用,通过该属性执行分组。我们通过提供功能接口的实现来实现这一点 - 通常通过传递lambda表达式。

例如,如果我们想按长度对字符串进行分组,我们可以通过将String :: length传递给groupingBy()来实现:

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, List<String>> result = strings.stream()
.collect(groupingBy(String::length));

System.out.println(result);
// {1=[a], 2=[bb, cc], 3=[ddd]}


分组到自定义Map实现
如果需要提供自定义Map实现,可以使用提供的groupingBy()重载来实现:


List<String> strings = List.of("a", "bb", "cc", "ddd");

TreeMap<Integer, List<String>> result = strings.stream()
.collect(groupingBy(String::length, TreeMap::new, toList()));

System.out.println(result);
// {1=[a], 2=[bb, cc], 3=[ddd]}


提供自定义的下一个Collection
如果需要将分组元素存储在自定义集合中,可以使用toCollection()收集器来实现。

例如,如果要在TreeSet实例中对元素进行分组,然后输出到一个新的Collection,则可以这样简单:

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, TreeSet<String>> result = strings.stream()
.collect(groupingBy(String::length, toCollection(TreeSet::new)));

System.out.println(result);
// {1=[a], 2=[bb, cc], 3=[ddd]}


分组计数
如果您只想知道分组元素的数量,提供自定义counting()j就可以:

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Long> result = strings.stream()
.collect(groupingBy(String::length, counting()));

System.out.println(result);
// {1=1, 2=2, 3=1}


将每个组转为字符串
如果需要对元素进行分组并为每个组创建单个String表示,可以使用join()来实现:

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, String> result = strings.stream()
.collect(groupingBy(String::length, joining(
",", "[", "]")));

System.out.println(result);
// {1=[a], 2=[bb,cc], 3=[ddd]}


分组和过滤条目
从分组结果中排除某些条目。这可以使用filtering()收集器来实现:

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, List<String>> result = strings.stream()
.collect(groupingBy(String::length, filtering(s -> !s.contains(
"c"), toList())));

System.out.println(result);
// {1=[a], 2=[bb], 3=[ddd]}


分组和计算每组平均值
如果需要派生每组条目的平均属性,那么有一些方便的收集器:

averagingInt()
averagingLong()
averagingDouble()


List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Double> result = strings.stream()
.collect(groupingBy(String::length, averagingInt(String::hashCode)));

System.out.println(result);
// {1=97.0, 2=3152.0, 3=99300.0}


分组和计算每组的总和
如果要对分组条目进行累计总和:

summingInt()
summingLong()
summingDouble()


List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Integer> result = strings.stream()
.collect(groupingBy(String::length, summingInt(String::hashCode)));

System.out.println(result);
// {1=97, 2=6304, 3=99300}


reducing缩减操作

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, List<Character>> result = strings.stream()
.map(toStringList())
.collect(groupingBy(List::size, reducing(List.of(), (l1, l2) -> Stream.concat(l1.stream(), l2.stream())
.collect(Collectors.toList()))));

System.out.println(result);
// {1=[a], 2=[b, b, c, c], 3=[d, d, d]}


计算最大最小值

List<String> strings = List.of("a", "bb", "cc", "ddd");

Map<Integer, Optional<String>> result = strings.stream()
.collect(groupingBy(String::length, Collectors.maxBy(Comparator.comparing(String::toUpperCase))));

System.out.println(result);
// {1=Optional[a], 2=Optional[cc], 3=Optional[ddd]}


组合Collector
示例#1
假设我们有一个字符串列表,并希望获得与长度大于1的大写字符串相关联的字符串长度的映射,并将它们收集到TreeSet实例中。

var result = strings.stream()
.collect(
groupingBy(String::length,
mapping(String::toUpperCase,
filtering(s -> s.length() > 1,
toCollection(TreeSet::new)))));

//result
{1=[], 2=[BB, CC], 3=[DDD]}


例#2
指定字符串列表,按匹配长度对它们进行分组,转换为字符列表,展平获取的列表,仅保留具有非零长度的不同元素,并最终通过应用字符串连接来减少它们。

var result = strings.stream()
.collect(
groupingBy(String::length,
mapping(toStringList(),
flatMapping(s -> s.stream().distinct(),
filtering(s -> s.length() > 0,
mapping(String::toUpperCase,
reducing("", (s, s2) -> s + s2)))))
));

//result
{1=A, 2=BC, 3=D}


The Ultimate Guide to the Java Stream API grouping