[英]Spark Streaming Kafka initial offset
我正在对KafkaUtils.createDirectStream使用Java Spark API,我想跟踪偏移量。 有一个名为fromOffset的参数,该参数在Kafka主题的分区中记录偏移量。 对于第一次运行,我不知道会有多少个分区,那么如何设置此参数? 我需要在Kafka参数中设置“ auto.offset.reset”吗? 如果是,是否会影响我的代码从已知偏移量中恢复?
您有两种选择:
如果您没有有关分区的任何信息,请不要将该参数提供给createDirectStream。 createDirectStream方法有多种实现。 在这种情况下,将使用每个topicPartition的最早或最新偏移量(基于auto.offset.reset
参数)
您可以使用常用的kafka API查找分区和偏移量。 例如,看看如何在Kafka 0.10中找到主题分区的偏移范围?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.