簡體   English   中英

將RDD [Row]另存為scala中的文件

[英]Save RDD[Row] as file in scala

我制作了RDD [Row] data(myData)並嘗試將其保存為文件

myData.saveAsFile("path")

output
(a, 100, testcontenct)
(b, 200, stackoverflow)

它運作良好,但是由於它將被視為csv,因此我需要刪除'('和')'符號。 我的最終目標輸出是

a, 100, testcontenct
b, 200, stackoverflow

如何制作沒有這些符號的輸出文件。

您可以使用databricks csv庫: https : //github.com/databricks/spark-csv

我認為它僅適用於數據幀,但是您可以輕松地將RDD轉換為數據幀

import sqlContext.implicits._
val myDf = myData.toDF

然后將其寫入文件

myDf.write
    .format("com.databricks.spark.csv")
    .save("path")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM