[英]How to convert hadoop avro, parquet, as well as text file to csv without spark
我有avro,鑲木地板和文本文件的hdfs版本。 不幸的是,我無法使用spark將它們轉換為csv。 我從一個較早的問題中看到,這似乎是不可能的。 如何將HDFS文件轉換為csv或tsv。 這可能嗎?如果可以,我該怎么做?
這將幫助您閱讀Avro文件(只需避免架構演變/修改...)。 例子
至於Parquet,您可以使用parquet-mr ,看看ParquetReader。 示例 :忽略Spark用法,他們只是使用它來創建Parquet文件,以便以后與ParquetReader一起使用。
希望能幫助到你
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.