繁体 English 中英

Spark Streaming在处理过程中定期维护kafka偏移

[英]Spark streaming maintain kafka offset periodically as it processes

原文 2016-05-24 05:25:33 4 1 apache-spark/ streaming/ apache-kafka/ offset

在来自Kafka的Spark Streaming直接方法中，有一种方法可以让我知道Kafka偏移级别范围。 但是，如果我想定期维护偏移量级别，以便在需要时可以重新处理偏移量中的项目。 处理每条消息时，有什么方法可以在rdd中检索消息的偏移量？ 例如，使用offsetranges，我具有RDD的开始和结束偏移量，但是如果在处理RDD系统的每个记录时遇到错误以及作业结束，该怎么办。 现在，如果我要从失败的记录开始处理，我该如何首先保存上一个成功的偏移量，以便下次启动时可以从该偏移量开始。

1 个解决方案

随着Spark 1.3的发布，有一种新的直接方法（无接收器）将这种底层的复杂性隐藏在幕后。 如果发生故障，重启后可以自动从Kafka恢复足够的Kafka保留消息。

Spark Streaming Kafka初始偏移

[英]Spark Streaming Kafka initial offset

Spark Streaming Kafka偏移量管理

[英]Spark Streaming kafka offset manage

Spark Structured Streaming Kafka Offset 管理

[英]Spark Structured Streaming Kafka Offset Management

Spark结构化流Kafka集成偏移管理

[英]Spark Structured Streaming Kafka Integration Offset management

Spark Structured Streaming Kafka 错误——偏移量已更改

[英]Spark Structured Streaming Kafka error -- offset was changed

从Kafka倒转偏移Spark结构化流

[英]Rewind Offset Spark Structured Streaming from Kafka

Spark流媒体应用程序不断重置kafka偏移量

[英]Spark streaming app resets kafka offset continuously

Spark Structured Streaming - kafka 偏移处理

[英]Spark Structured Streaming - kafka offset handling

Spark Structured Streaming NOT 处理 Kafka 偏移量过期

[英]Spark Structured Streaming NOT process Kafka offset expires

在使用 Kafka 的 Spark Structured streaming 中，Spark 如何管理多个主题的偏移量

[英]In Spark Structured streaming with Kafka, how spark manages offset for multiple topics

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Spark Streaming Kafka初始偏移 Spark Streaming Kafka偏移量管理 Spark Structured Streaming Kafka Offset 管理 Spark结构化流Kafka集成偏移管理 Spark Structured Streaming Kafka 错误——偏移量已更改从Kafka倒转偏移Spark结构化流 Spark流媒体应用程序不断重置kafka偏移量 Spark Structured Streaming - kafka 偏移处理 Spark Structured Streaming NOT 处理 Kafka 偏移量过期在使用 Kafka 的 Spark Structured streaming 中，Spark 如何管理多个主题的偏移量

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM