Kafka 消费者的主题和分区发现

Question

我对 Flink 和 Kafka 相当陌生，并且在 Scala 中编写了一些数据聚合作业，这些作业在 Apache Flink 中运行，这些作业使用来自 Kafka 的数据执行聚合并将结果返回给 Kafka。

我需要这些作业来使用在作业运行时创建的与模式匹配的任何新 Kafka 主题的数据。 我通过为我的消费者设置以下属性来完成这项工作

val properties = new Properties()
properties.setProperty(“bootstrap.servers”, “my-kafka-server”)
properties.setProperty(“group.id”, “my-group-id”)
properties.setProperty(“zookeeper.connect”, “my-zookeeper-server”)
properties.setProperty(“security.protocol”, “PLAINTEXT”)
properties.setProperty(“flink.partition-discovery.interval-millis”, “500”);
properties.setProperty(“enable.auto.commit”, “true”);
properties.setProperty(“auto.offset.reset”, “earliest”);

val consumer = new FlinkKafkaConsumer011[String](Pattern.compile(“my-topic-start-.*”), new SimpleStringSchema(), properties)

消费者工作正常并使用以“my-topic-start-”开头的现有主题的数据

当我第一次发布针对新主题的数据时，例如“my-topic-start-test1”，我的消费者直到主题创建后 500 毫秒后才识别该主题，这是基于属性的。 当消费者识别出主题时，它不会读取发布的第一条数据记录，而是开始有效地读取后续记录，每次针对新主题发布数据时，我都会丢失第一条数据记录。

是否有我遗漏的设置或者卡夫卡的工作方式？ 任何帮助，将不胜感激。

谢谢Shravan

Answer 1

我认为部分问题是我的生产者在一个 go 中创建主题并发布消息，所以当消费者发现新分区时，该消息已经生成。

作为一个临时解决方案，我更新了我的生产者以创建该主题（如果它不存在），然后发布一条消息（使其成为 2 步过程）并且这有效。

不过，如果有一个更强大的消费者端解决方案会很好:)

Kafka 消费者的主题和分区发现

问题描述

1 个解决方案

解决方案1
0 2021-05-06 17:03:01

Kafka 消费者的主题和分区发现

问题描述

1 个解决方案

解决方案1 0 2021-05-06 17:03:01

解决方案1
0 2021-05-06 17:03:01