apache-kafka - 同一 Kafka 主题的多个 Flink 管道

背景

我们有一个具有稳定 stream 数据的 Kafka 主题。 为了处理它，我们有一个无状态的 Flink 管道，它使用该主题并写入另一个主题。

有时我们会收到大量信息，我们的 Flink 未配置为处理这些信息。 我们不想将 Flink 管道和集群配置为始终支持我们可以拥有的最大负载，我们希望根据负载动态扩展。 （预算原因 $$$）

我们想到的解决方案

一种方法是向 Flink 集群添加/删除节点并更改 Flink 管道操作符的并行度。 这将需要使用快照停止 Flink 作业，重新配置并行度并使用新的并行度重新启动。

这会很棒，但我们不能允许自己出现它产生的停机时间。 我们必须在不停机的情况下扩大/缩小规模。

如果我们使用常规的 Kafka 消费者，那么就像添加消费者一样简单（假设我们有足够的 Kafka 分区），并且 Kafka 会在所有消费者之间重新分配主题分区。

Flink Kafka 消费者自己管理分区分配和偏移量，这允许精确一次语义（我们不需要它）。 缺点是单个 Flink 作业总是使用所有主题分区。

我们认为我们可以创建另一个 Flink 实例，该实例将订阅同一组的同一主题，并让 Kafka 在它们之间分配分区。 但是为此，我们需要 Kafka Flink 消费者来让 Kafka 管理哪些分区分配给哪个消费者。

[英]Send in multiple topic kafka sink with flink

[英]Kafka multiple partitions of the same topic in the same broker

[英]Kafka: Can we have consumers subscribing to same topic but have different pipelines inside the topic?

[英]Kafka multiple producer writing to same topic?

[英]Create multiple consumers for same topic in kafka

[英]Kafka Producer (with multiple instance) writing to same topic

[英]Listen to multiple type of objects in the same Kafka topic

[英]Kafka ordering with multiple producers on same topic and parititon

[英]Kafka topic to multiple kafka topics dispatcher (same cluster)

[英]Consuming from the beginning of a kafka topic with Flink

同一 Kafka 主题的多个 Flink 管道