繁体   English   中英

如何将Spark数据框写入xml文件?

[英]How to write Spark data frame to xml file?

样品:

scala> Frame.show()

|year| make|model|             comment|blank|
|2012|Tesla|    S|          No comment|    R|
|1997| Ford| E350|Go get one now th...|    L|
|2015|Chevy| Volt|                 Try|    M|

<item>
    <'year'>2012<'/year'>
    <'make'>Tesla<'/make'>
    <'model'>S<'/mode'>
</item>

最简单的方法是使用spark-xml

val path: String = ???
df.write.format("com.databricks.spark.xml")
  .option("rootTag", "items")
  .option("rowTag", "item")
  .save(path)

如果由于某种原因它不符合您的需求,您可以单独转储记录并saveAsTextFile

def dumpXML(row: Row): String = ???
df.rdd.map(dumpXML).saveAsTextFile(path)

您可以使用例如mapPartitions添加根元素。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM