簡體 English 中英

Trigger.Once Spark Structured Streaming with KAFKA offsets 和寫入 KAFKA 繼續

[英]Trigger.Once Spark Structured Streaming with KAFKA offsets and writing to KAFKA continues

原文 2022-02-25 09:26:21 8 1 apache-spark/ apache-kafka/ databricks/ spark-structured-streaming

將 Spark Structured Streaming 與Trigger.Once結合使用並處理 KAFKA 輸入時
- 然后如果運行Trigger.Once調用
  - 並且同時寫入 KAFKA
    - Trigger.Once調用是否會看到在當前調用期間寫入的那些較新的 KAFKA 記錄？
    - 或者直到下次調用Trigger.Once時才會看到它們？

1 個解決方案

從手冊中：它處理所有。 見下文。

配置增量批處理 Apache Spark 提供了 .trigger(once=True) 選項來將源目錄中的所有新數據作為單個微批處理。 此觸發一次模式忽略所有設置以控制流輸入大小，這可能導致大量溢出或內存不足錯誤。

Databricks 在 Databricks Runtime 10.2 及更高版本中支持 trigger(availableNow=True) 用於 Delta Lake 和 Auto Loader 源。 此功能將一次性觸發的批處理方法與配置批大小的能力相結合，從而產生多個並行批，從而更好地控制正確調整批大小和生成的文件。

Spark 3 結構化流在 Kafka 源代碼中使用 maxOffsetsPerTrigger 和 Trigger.Once

[英]Spark 3 structured streaming use maxOffsetsPerTrigger in Kafka source with Trigger.Once

將 Spark 結構化流與 Trigger.Once 結合使用

[英]Using Spark Structured Streaming with Trigger.Once

使用Spark Structured Streaming編寫時捕獲Kafka偏移量

[英]Capturing Kafka offsets when writing with Spark Structured Streaming

Spark Structured Streaming 在帶有 Trigger.Once 的 Databricks 上顯示沒有 output

[英]Spark Structured Streaming shows no output on Databricks with Trigger.Once

Spark Structured Streaming 不會在 Kafka 偏移量處重新啟動

[英]Spark Structured Streaming not restarting at Kafka offsets

清除偏移量激發來自 kafka 的結構化流

[英]Clear offsets spark structured streaming from kafka

將Spark結構化流輸出寫入Kafka主題

[英]Writing Spark Structured Streaming Output to a Kafka Topic

PySpark 結構化流：一旦不與 Kafka 一起使用就觸發

[英]PySpark Structured Streaming: trigger once not working with Kafka

如何在火花結構化流讀取流中倒帶 Kafka Offsets

[英]How to rewind Kafka Offsets in spark structured streaming readstream

如何使用 Trigger.Once 選項在 Spark 3 Structure Stream Kafka/Files 源中配置背壓

[英]How to configure backpreasure in Spark 3 Structure Stream Kafka/Files source with Trigger.Once option

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Spark 3 結構化流在 Kafka 源代碼中使用 maxOffsetsPerTrigger 和 Trigger.Once 將 Spark 結構化流與 Trigger.Once 結合使用使用Spark Structured Streaming編寫時捕獲Kafka偏移量 Spark Structured Streaming 在帶有 Trigger.Once 的 Databricks 上顯示沒有 output Spark Structured Streaming 不會在 Kafka 偏移量處重新啟動清除偏移量激發來自 kafka 的結構化流將Spark結構化流輸出寫入Kafka主題 PySpark 結構化流：一旦不與 Kafka 一起使用就觸發如何在火花結構化流讀取流中倒帶 Kafka Offsets 如何使用 Trigger.Once 選項在 Spark 3 Structure Stream Kafka/Files 源中配置背壓

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM