簡體 English 中英

來自 JDBC 源的 Spark 結構化流

[英]Spark structured streaming from JDBC source

原文 2022-02-26 01:33:18 7 2 apache-spark/ pyspark/ databricks/ azure-databricks/ spark-structured-streaming

有人可以讓我知道是否可以從 JDBC 源進行 Spark 結構化流式傳輸？ 例如 SQL DB 或任何 RDBMS。

我看過一些關於 SO 的類似問題，例如

Spark streaming jdbc 在數據到來時讀取流 - 數據源 jdbc 不支持流式讀取

jdbc 源和 spark 結構化流

但是，我想知道它是否在 Apache Spark 上得到官方支持？

如果有任何有用的示例代碼。

謝謝

2 個解決方案

不，Spark Structured Streaming 中沒有這樣的內置支持。 主要原因是大多數數據庫沒有提供統一的接口來獲取更改。

可以使用歸檔日志、預寫日志等從某些數據庫中獲取更改。但它是特定於數據庫的。 對於許多數據庫來說，流行的選擇是Debezium ，它可以讀取此類日志並將更改列表推送到 Kafka 或類似的東西中，Spark 可以從中使用它。

我現在正在一個項目中使用來自 ORACLE 的 CDC Shareplex 並寫入 KAFKA，然后使用 Spark Structured Streaming 與 KAFKA 集成和 MERGE 在 HDFS 上的增量格式上進行架構。

也就是說，如果不使用 Debezium，那就是這樣做的方法。 您可以使用基表或物化視圖的更改日志來提供 CDC。

所以直接 JDBC 是不可能的。

jdbc源代碼和Spark結構化流

[英]jdbc source and spark structured streaming

使用RabbitMQ源的Spark結構化流式傳輸

[英]Spark Structured Streaming with RabbitMQ source

Spark結構化流中的MQ源

[英]MQ Source in Spark Structured Streaming

Spark 結構化流：JDBC 接收器中的主鍵

[英]Spark Structured streaming: primary key in JDBC sink

Spark結構化流文件源開始偏移

[英]Spark Structured Streaming File Source Starting Offset

Spark Structured Streaming Kinesis 數據源

[英]Spark Structured Streaming Kinesis Data source

Spark結構化流媒體源保留策略

[英]Spark Structured Streaming source retention policy

如何注冊自定義Spark結構化流源

[英]How to register custom Spark structured streaming source

Spark：使用持久表作為 Spark 結構化流的流源

[英]Spark: Use Persistent Table as Streaming Source for Spark Structured Streaming

如何為Spark結構化流編寫JDBC Sink [SparkException：Task not serializable]？

[英]How to write JDBC Sink for Spark Structured Streaming [SparkException: Task not serializable]?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 jdbc源代碼和Spark結構化流使用RabbitMQ源的Spark結構化流式傳輸 Spark結構化流中的MQ源 Spark 結構化流：JDBC 接收器中的主鍵 Spark結構化流文件源開始偏移 Spark Structured Streaming Kinesis 數據源 Spark結構化流媒體源保留策略如何注冊自定義Spark結構化流源 Spark：使用持久表作為 Spark 結構化流的流源如何為Spark結構化流編寫JDBC Sink [SparkException：Task not serializable]？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM