簡體 English 中英

Spark Streaming在處理過程中定期維護kafka偏移

[英]Spark streaming maintain kafka offset periodically as it processes

原文 2016-05-24 05:25:33 2 1 apache-spark/ streaming/ apache-kafka/ offset

在來自Kafka的Spark Streaming直接方法中，有一種方法可以讓我知道Kafka偏移級別范圍。 但是，如果我想定期維護偏移量級別，以便在需要時可以重新處理偏移量中的項目。 處理每條消息時，有什么方法可以在rdd中檢索消息的偏移量？ 例如，使用offsetranges，我具有RDD的開始和結束偏移量，但是如果在處理RDD系統的每個記錄時遇到錯誤以及作業結束，該怎么辦。 現在，如果我要從失敗的記錄開始處理，我該如何首先保存上一個成功的偏移量，以便下次啟動時可以從該偏移量開始。

1 個解決方案

隨着Spark 1.3的發布，有一種新的直接方法（無接收器）將這種底層的復雜性隱藏在幕后。 如果發生故障，重啟后可以自動從Kafka恢復足夠的Kafka保留消息。

Spark Streaming Kafka初始偏移

[英]Spark Streaming Kafka initial offset

Spark Streaming Kafka偏移量管理

[英]Spark Streaming kafka offset manage

Spark Structured Streaming Kafka Offset 管理

[英]Spark Structured Streaming Kafka Offset Management

Spark結構化流Kafka集成偏移管理

[英]Spark Structured Streaming Kafka Integration Offset management

Spark Structured Streaming Kafka 錯誤——偏移量已更改

[英]Spark Structured Streaming Kafka error -- offset was changed

從Kafka倒轉偏移Spark結構化流

[英]Rewind Offset Spark Structured Streaming from Kafka

Spark流媒體應用程序不斷重置kafka偏移量

[英]Spark streaming app resets kafka offset continuously

Spark Structured Streaming - kafka 偏移處理

[英]Spark Structured Streaming - kafka offset handling

Spark Structured Streaming NOT 處理 Kafka 偏移量過期

[英]Spark Structured Streaming NOT process Kafka offset expires

在使用 Kafka 的 Spark Structured streaming 中，Spark 如何管理多個主題的偏移量

[英]In Spark Structured streaming with Kafka, how spark manages offset for multiple topics

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Spark Streaming Kafka初始偏移 Spark Streaming Kafka偏移量管理 Spark Structured Streaming Kafka Offset 管理 Spark結構化流Kafka集成偏移管理 Spark Structured Streaming Kafka 錯誤——偏移量已更改從Kafka倒轉偏移Spark結構化流 Spark流媒體應用程序不斷重置kafka偏移量 Spark Structured Streaming - kafka 偏移處理 Spark Structured Streaming NOT 處理 Kafka 偏移量過期在使用 Kafka 的 Spark Structured streaming 中，Spark 如何管理多個主題的偏移量

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM