我想将org.apache.spark.rdd.RDD [（Any，scala.collection.immutable.Iterable [String]）]展平为Scala中的String

Question

Example 例

(168,20874,List(, 33895, 2711)) （168,20874，List（，33895，2711））

to 168,20874| 到168,20874 | , 33895, 2711 ，33895、2711

Basically convert RDD[(Any, scala.collection.immutable.Iterable[String])] to String. 基本上将RDD [（Any，scala.collection.immutable.Iterable [String]）]转换为String。

Thanks 谢谢

Answer 1

Method "map" with predefined formatter can be used: 可以使用带有预定义格式器的方法“ map”：

val rdd = sparkContext.parallelize(List((168, 20874, List(33895, 2711))))
val result = rdd.map { case (a, b, c) => s"$a,$b| ,${c.mkString(",")}" }
result.foreach(println)

Output: 输出：

168,20874| ,33895,2711

我想将org.apache.spark.rdd.RDD [（Any，scala.collection.immutable.Iterable [String]）]展平为Scala中的String

问题描述

1 个解决方案

解决方案1
0 已采纳 2018-10-23 09:04:38

我想将org.apache.spark.rdd.RDD [（Any，scala.collection.immutable.Iterable [String]）]展平为Scala中的String

问题描述

1 个解决方案

解决方案1 0 已采纳 2018-10-23 09:04:38

解决方案1
0 已采纳 2018-10-23 09:04:38