繁体 English 中英

Kafka 中的 Spark Offset 管理

[英]Spark Offset Management in Kafka

原文 2020-09-30 07:46:01 5 1 apache-spark/ spark-structured-streaming/ spark-kafka-integration

我正在使用 Spark Structured Streaming（版本 2.3.2）。 我需要从 Kafka Cluster 读取并写入 Kerberized Kafka。 这里我想在记录写入 Kerberized Kafka 后使用 Kafka 作为偏移检查点。

问题：

我们可以使用 Kafka 检查点来管理偏移量还是只需要使用 HDFS/S3？

请帮忙。

1 个解决方案

我们可以使用 Kafka 检查点来管理偏移量吗

不，您不能将偏移量提交回源 Kafka 主题。 这在此处有详细描述，当然在官方Spark Structured Streaming + Kafka 集成指南中也有详细描述。

还是我们只需要使用 HDFS/S3？

是的，这必须类似于 HDFS 或 S3。 这在 StructuredStreaming 编程指南的检查点故障恢复部分中进行了解释：“此检查点位置必须是HDFS 兼容文件系统中的路径，并且可以在启动查询时设置为 DataStreamWriter 中的一个选项。”

Spark Structured Streaming Kafka Offset 管理

[英]Spark Structured Streaming Kafka Offset Management

Spark结构化流Kafka集成偏移管理

[英]Spark Structured Streaming Kafka Integration Offset management

使用Spark结构化流式2.2批处理API的Kafka偏移量管理

[英]Kafka offset management with Spark structured streaming 2.2 batch API

火花中的卡夫卡偏移

[英]kafka offset in spark

Spark Streaming Kafka初始偏移

[英]Spark Streaming Kafka initial offset

Spark Streaming Kafka偏移量管理

[英]Spark Streaming kafka offset manage

KafkaUtils API | 抵消管理| Spark Streaming

[英]KafkaUtils API | offset management | Spark Streaming

Spark Streaming在处理过程中定期维护kafka偏移

[英]Spark streaming maintain kafka offset periodically as it processes

Spark Structured Streaming Kafka 错误——偏移量已更改

[英]Spark Structured Streaming Kafka error -- offset was changed

从Kafka倒转偏移Spark结构化流

[英]Rewind Offset Spark Structured Streaming from Kafka

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Spark Structured Streaming Kafka Offset 管理 Spark结构化流Kafka集成偏移管理使用Spark结构化流式2.2批处理API的Kafka偏移量管理火花中的卡夫卡偏移 Spark Streaming Kafka初始偏移 Spark Streaming Kafka偏移量管理 KafkaUtils API | 抵消管理| Spark Streaming Spark Streaming在处理过程中定期维护kafka偏移 Spark Structured Streaming Kafka 错误——偏移量已更改从Kafka倒转偏移Spark结构化流

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM