簡體 English 中英

構建 Spark 結構化流管道的最佳方法是什么？

[英]What is the best way to structure a spark structured streaming pipeline?

原文 2020-08-08 04:52:37 8 1 apache-spark/ spark-streaming/ spark-structured-streaming/ spark-streaming-kafka

我正在將數據從我的 postgres 數據庫移動到 kafka，並在中間使用 spark 進行一些轉換。 我有 50 張桌子，每張桌子都有與其他桌子完全不同的轉換。 所以，我想知道如何構建我的 spark 結構化流代碼的最佳方式。 我認為有三個選擇：

要將這 50 個表的所有讀寫邏輯放在一個 object 中，並且只調用這個 object。
為每個表創建 50 個不同的對象，並在新的 object 中創建一個調用 50 個對象中的每一個的主方法，然后調用 spark.streams.awaitAnyTermination()
通過 spark submit 單獨提交這 50 個對象中的每一個

如果存在其他更好的選擇，請與我交談。

謝謝

1 個解決方案

根據您的方法 1 創建單個 object 看起來不太好。 這將難以理解和維護。

在第 2 步和第 3 步之間，我仍然更喜歡第 3 步。 維護單獨的作業會有點麻煩（管理部署和構建公共代碼），但如果做得好，它將給我們更多的靈活性。 如果需要，我們可以輕松地取消部署單個表。 此外，任何后續部署或更改都意味着僅部署相關的表流。 其他現有的表管道將繼續工作。

使用 Spark 結構化流從許多不同的 kafka 代理中消費相同主題的最佳方式是什么？

[英]What is the best way to consume the same topic from many different kafka brokers with spark structured streaming?

Spark 結構化流式最佳 VM

[英]Spark structured streaming best VMs

Spark 結構化流中的管道使用 foreachBatch

[英]Pipeline in Spark Structured Streaming using foreachBatch

重新啟動火花流應用程序的最佳方法是什么？

[英]What is the best way to restart spark streaming application?

有沒有辦法動態停止 Spark Structured Streaming？

[英]Is there a way to dynamically stop Spark Structured Streaming?

Spark Structured Streaming和DStreams有什么區別？

[英]What is the difference between Spark Structured Streaming and DStreams?

這些指標對 Spark Structured Streaming 意味着什么？

[英]What do these metrics mean for Spark Structured Streaming?

Spark Structured Streaming 中 ForeachWriter 的用途是什么？

[英]What is the purpose of ForeachWriter in Spark Structured Streaming?

Spark結構流中的LocalTableScan有什么用？

[英]What is LocalTableScan in Spark Structure Streaming for?

使用 Scala 在 Spark 流應用程序中編寫優化 UDF 的最佳方法是什么？

[英]What is the best way to write Optimized UDF in spark streaming application with Scala?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用 Spark 結構化流從許多不同的 kafka 代理中消費相同主題的最佳方式是什么？ Spark 結構化流式最佳 VM Spark 結構化流中的管道使用 foreachBatch 重新啟動火花流應用程序的最佳方法是什么？有沒有辦法動態停止 Spark Structured Streaming？ Spark Structured Streaming和DStreams有什么區別？這些指標對 Spark Structured Streaming 意味着什么？ Spark Structured Streaming 中 ForeachWriter 的用途是什么？ Spark結構流中的LocalTableScan有什么用？使用 Scala 在 Spark 流應用程序中編寫優化 UDF 的最佳方法是什么？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM