繁体   English   中英

Spark Streaming Kafka初始偏移

[英]Spark Streaming Kafka initial offset

我正在对KafkaUtils.createDirectStream使用Java Spark API,我想跟踪偏移量。 有一个名为fromOffset的参数,该参数在Kafka主题的分区中记录偏移量。 对于第一次运行,我不知道会有多少个分区,那么如何设置此参数? 我需要在Kafka参数中设置“ auto.offset.reset”吗? 如果是,是否会影响我的代码从已知偏移量中恢复?

您有两种选择:

  • 如果您没有有关分区的任何信息,请不要将该参数提供给createDirectStream。 createDirectStream方法有多种实现。 在这种情况下,将使用每个topicPartition的最早或最新偏移量(基于auto.offset.reset参数)

  • 您可以使用常用的kafka API查找分区和偏移量。 例如,看看如何在Kafka 0.10中找到主题分区的偏移范围?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM