[英]How to convert hadoop avro, parquet, as well as text file to csv without spark
我有avro,镶木地板和文本文件的hdfs版本。 不幸的是,我无法使用spark将它们转换为csv。 我从一个较早的问题中看到,这似乎是不可能的。 如何将HDFS文件转换为csv或tsv。 这可能吗?如果可以,我该怎么做?
这将帮助您阅读Avro文件(只需避免架构演变/修改...)。 例子
至于Parquet,您可以使用parquet-mr ,看看ParquetReader。 示例 :忽略Spark用法,他们只是使用它来创建Parquet文件,以便以后与ParquetReader一起使用。
希望能帮助到你
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.