繁体   English   中英

在txt文件中写入RDD

[英]Write RDD in txt file

我有以下类型的数据:

  `org.apache.spark.rdd.RDD[org.apache.spark.rdd.RDD[((String, String),Int)]] = MapPartitionsRDD[29] at map at <console>:38`

我想将这些数据写入一个 txt 文件中

((like,chicken),2) ((like,dog),3) etc.

我将数据存储在一个名为res的变量中

但目前我试过这个:

res.coalesce(1).saveAsTextFile("newfile.txt")

但它似乎不起作用......

如果我的假设是正确的,那么您会认为输出应该是单个 .txt 文件,如果它coalesce到一个工人。 这不是 Spark 的构建方式。 它适用于分布式工作,不应试图将其硬塞进一种不分发输出的形式。 为此,您应该使用更通用的命令行工具。

newfile.txt ,您应该会看到一个名为newfile.txt的文件夹,其中包含具有您预期输出的数据文件。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM