![](/img/trans.png)
[英]reduce variable number of tuples Sequences to Map[Key, List[Value]] in Scala
[英]Scala reduce Sequence of Map to a Map with max value for each key
我有一个 Map 的序列,如下所示:
Seq(
Map("k1" -> 1),
Map("k1" -> 2),
Map("k2" -> 3),
Map("k2" -> 4)
)
我想减少到单个 map 的值等于每个(key,value)
的最大值
预期结果:
Seq(
Map("k1" -> 2),
Map("k2" -> 4)
)
如何减少 map 的序列?
在2.13
上,您可以这样做:
def mergeMapsWithMax[K, V : Ordering](data: IterableOnce[Map[K, V]]): Map[K, V] =
data
.iterator
.flatten
.toList
.groupMapReduce(_._1)(_._2)(Ordering[V].max)
您可以像这样使用它:
val data = Seq(
Map("k1" -> 1),
Map("k1" -> 2),
Map("k2" -> 3),
Map("k2" -> 4)
)
// data: Seq[scala.collection.immutable.Map[String,Int]] = List(Map(k1 -> 1), Map(k1 -> 2), Map(k2 -> 3), Map(k2 -> 4))
mergeMapsWithMax(data)
// res: Map[String,Int] = Map(k1 -> 2, k2 -> 4)
假设您重新考虑使用元组列表而不是映射序列
val tuples = List(
("k1", 1),
("k1", 2),
("k2", 3),
("k2", 4)
)
像这样尝试foldLeft
tuples.foldLeft(Map.empty[String, Int]) { case (acc, t @ (key, value)) =>
acc.get(key) match {
case Some(oldValue) => if (oldValue >= value) acc else acc + t
case None => acc + t
}
}
// val res0: Map[String,Int] = Map(k1 -> 2, k2 -> 4)
或使用updatedWith
tuples.foldLeft(Map.empty[String, Int]) { case (acc, t @ (key, value)) =>
acc.updatedWith(key) {
case Some(oldValue) => Some(math.max(oldValue, value))
case None => Some(value)
}
}
// val res1: Map[String,Int] = Map(k1 -> 2, k2 -> 4)
这应该是相当高效的,因为我们是单次Map
的查找/添加默认情况下具有有效的恒定时间。
Seq(Map("k1" -> 1), Map("k1" -> 2), Map("k2" -> 3), Map("k2" -> 4))
.reduce { (m1, m2) =>
(m1.toSeq ++ m2.toSeq).groupBy(_._1).map {
case (k, values) => k -> values.map(_._2).max
}
}
生产
Map(k2 -> 4, k1 -> 2)
<script src="https://scastie.scala-lang.org/3aqyPILyRAS1tUagYcpq7w.js"></script>
如果您决定使用映射而不是元组,请使用这个简短(但不一定有效)的版本:
mapSeq.flatMap(_.toList).groupBy(_._1).map(_._2.max)
否则,您可以使用
tupleSeq.groupBy(_._1).map(_._2.max)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.