[英]Scala And Spark , rdd to dataframe creation from of dictionary
您能否让我知道如何从以下代码创建数据框架?
val x =List(Map("col1"->"foo","col2"->"bar"))
val RDD =sc.parallelize(x)
输入如上所示,即RDD[Map[String, String]]
要隐式转换为数据框,其中col1和col2为列名,而foo和bar为一行。
您可以创建一个案例类,将rdd中的Maps转换为案例类,然后toDF
应该可以工作:
case class r(col1: Option[String], col2: Option[String])
RDD.map(m => r(m.get("col1"), m.get("col2"))).toDF.show
+----+----+
|col1|col2|
+----+----+
| foo| bar|
+----+----+
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.