繁体   English   中英

使用Spark结构化流式2.2批处理API的Kafka偏移量管理

[英]Kafka offset management with Spark structured streaming 2.2 batch API

只想知道Kafka偏移量的检查点是否适用于Spark结构化流(2.2)批处理API,还是我们需要管理偏移量?

如果您指的是批处理DataFrame阅读器(例如spark.read.format("kafka") ),而不是流阅读器(例如spark.readStream.format("kafka") ),则说明没有内置抵消管理。 由于它是一个批处理API,因此通常您可以按此处所述自行指定偏移量。 对于流式传输,Spark可以为您执行偏移管理,因为它会在连续处理时读取多个范围的批次。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM