簡體 English 中英

在沒有Spark的情況下在Scala中創建Parquet文件

[英]Create Parquet file in Scala without Spark

原文 2018-10-09 20:37:07 5 1 scala/ parquet

我正在嘗試使用Scala（無Spark）將流式JSON消息直接寫入Parquet。 我看到只有幾個在線帖子和這篇文章，但我看到ParquetWriter API已被棄用，解決方案實際上並未提供一個示例。 我也閱讀了其他一些帖子，但沒有找到任何描述性的解釋。

我知道我必須使用ParquetFileWriter API，但缺乏文檔使我難以使用它。 有人可以提供它的例子以及所有構造函數參數以及如何創建這些參數，尤其是模式？

1 個解決方案

您可能想嘗試使用Eel ，一個工具包來操縱Hadoop生態系統中的數據。

我建議閱讀自述文件以更好地理解庫，但為了讓您了解庫的工作原理，您嘗試做的事情看起來有點像下面這樣：

val source = JsonSource(() => new FileInputStream("input.json"))
val sink = ParquetSink(new Path("output.parquet"))
source.toDataStream().to(sink)

使用 Scala 為 spark 編寫 Parquet 文件而無需 spark 作為依賴項

[英]Writing Parquet files with Scala for spark without spark as dependency

Scala：如何返回鑲木地板文件的選項[Dataframe]（位於adls中）-不使用spark / sql會話

[英]Scala: How can I return Option[Dataframe] of parquet file(which is in adls) - without using spark/sql session

在不使用Spark的情況下從Scala讀取Parquet文件

[英]Read Parquet files from Scala without using Spark

Scala Spark - 覆蓋鑲木地板文件無法刪除文件或目錄

[英]Scala Spark - overwrite parquet file failed to delete file or dir

在Scala中使用Apache Spark在S3中寫入鑲木地板文件時出錯

[英]Error writing parquet file in S3 with Apache Spark in Scala

使用嵌套數組和StructType Spark Scala展平Parquet文件

[英]Flatten Parquet File with nested Arrays and StructType Spark Scala

獲取HDFS中的實木復合地板文件的大小以便在Scala中與Spark進行分區

[英]get size of parquet file in HDFS for repartition with Spark in Scala

如何刪除 spark scala 中的鑲木地板文件？

[英]How do I delete a parquet file in spark scala?

讀取 Parquet 文件 Spark Scala

[英]Read Parquet files Spark Scala

如何在 scala 中創建拼花表？

[英]How create parquet table in scala?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用 Scala 為 spark 編寫 Parquet 文件而無需 spark 作為依賴項 Scala：如何返回鑲木地板文件的選項[Dataframe]（位於adls中）-不使用spark / sql會話在不使用Spark的情況下從Scala讀取Parquet文件 Scala Spark - 覆蓋鑲木地板文件無法刪除文件或目錄在Scala中使用Apache Spark在S3中寫入鑲木地板文件時出錯使用嵌套數組和StructType Spark Scala展平Parquet文件獲取HDFS中的實木復合地板文件的大小以便在Scala中與Spark進行分區如何刪除 spark scala 中的鑲木地板文件？讀取 Parquet 文件 Spark Scala 如何在 scala 中創建拼花表？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM