Java将字符串集合减少到出现的映射

Question

将列表视为id1_f, id2_d, id3_f, id1_g ，如何使用流来获取统计信息的<String, Integer>格式的简化映射，如：

id1 2
id2 1
id3 1

注意：键在_之前是部分。 reduce功能可以帮助吗？

Answer 1

这将完成工作：

Map<String, Long> map = Stream.of("id1_f", "id2_d", "id3_f", "id1_g")
  .collect(
    Collectors.groupingBy(v -> v.split("_")[0],
    Collectors.counting())
  );

Answer 2

您还可以使用toMap收集器：

myList.stream()
      .collect(Collectors.toMap((String s) -> s.split("_")[0], 
                   (String s) -> 1, Math::addExact);

如果您关心元素的顺序，则将结果转储到LinkedHashMap 。

myList.stream()
      .collect(Collectors.toMap((String s) -> s.split("_")[0], 
                   (String s) -> 1, Math::addExact, 
                     LinkedHashMap::new));

Answer 3

使用Map :: merge的非流方法：

Map<String, Integer> result = new LinkedHashMap<>();
myList.forEach(s -> result.merge(s.split("_")[0], 1, Math::addExact));

Answer 4

由于你想要计算元素，我建议使用Guava的Multiset接口，它专门用于此目的。

从JavaDoc中定义Multiset ：

支持与顺序无关的相等的集合，如Set ，但可能具有重复的元素。 multiset有时也被称为包。

多重集是彼此相等的元件被称为相同的单个元件的出现。 多集中元素的出现总数称为该元素的计数。

以下是两种使用方法：

1）没有Stream API：

ImmutableMultiset<String> multiset2 = ImmutableMultiset.copyOf(Lists.transform(
        list, str -> StringUtils.substringBefore(str, "_")
));

2）使用Stream API：

ImmutableMultiset<String> multiset = list.stream()
        .map(str -> StringUtils.substringBefore(str, "_"))
        .collect(ImmutableMultiset.toImmutableMultiset());

请注意，我没有使用类似s.split("_")[0] ，而是使用了Apache Commons Lang的StringUtils.substringBefore ，我发现它更具可读性。

您可以使用Multiset.count()方法检索元素的计数。

Java将字符串集合减少到出现的映射

问题描述

4 个解决方案

解决方案1
6 已采纳 2018-07-25 22:52:58

解决方案2
0 2018-07-25 23:28:08

解决方案3
0 2018-07-25 23:38:49

解决方案4
0 2018-07-26 08:03:49

Java将字符串集合减少到出现的映射

问题描述

4 个解决方案

解决方案1 6 已采纳 2018-07-25 22:52:58

解决方案2 0 2018-07-25 23:28:08

解决方案3 0 2018-07-25 23:38:49

解决方案4 0 2018-07-26 08:03:49

解决方案1
6 已采纳 2018-07-25 22:52:58

解决方案2
0 2018-07-25 23:28:08

解决方案3
0 2018-07-25 23:38:49

解决方案4
0 2018-07-26 08:03:49