繁体 English 中英

多个 Kafka 生产者写入同一主题 - 如何负载平衡消费

[英]Multiple Kafka Producers writing to the same topic - how to load balance consumption

原文 2020-05-20 18:38:29 6 1 apache-kafka/ kafka-consumer-api/ kafka-producer-api

所以我有一个设计，我有多个生产者 P1、P2、P3、P4... PN 写入具有 32 个分区的单个主题 T1。

另一方面，我在一个消费者组中最多有 32 个消费者。

我想对我的消息消耗进行负载平衡。

阅读文档我可以看到 3 个选项：
1. 自己定义分区（缺点我必须知道最后一条消息是在哪里发送的或者为每个Producer P定义一个分区范围）
2. 定义一个键并将分区决策留给 Kafka hash 算法（缺点 - 负载平衡将根据运气定义）

（根据克里斯的回答，负载平衡应该留给 hash 算法） - 现实情况表明，这并没有为消费者提供平等的分配，因为消费者绑定到分区，我必须了解 hash 算法才能选择一个好的密钥 -对我来说，这听起来与选择分区相同（并且必须分配给生产者）

我当前的代码使用 UUID 作为键。 对所选分区以及消费者工作的分析表明，分布可能远非相等。 我在下面复制它：

上图显示了每个分区在 5 分钟内收到的消息数量 window 使用 UUID 作为我的键 - 在那个时间点我有 8 个消费者。 消耗大约需要2分钟。 红色单元格显示其中一个消费者中有 9 个请求队列，而其他消费者的负载较低 - 或者像绿色消费者一样为零负载。 如果随机密钥不是一个好的选择，我应该选择什么？

没有分区，没有密钥，留给 Kafka 循环算法（缺点循环是生产者内部的 - 这意味着所有生产者都可以将消息发送到同一个分区 - 我也测试了这个选项，结果如下：

上图显示循环显然是生产者内部的。

我真的需要自己编写整体负载均衡算法吗？ 我错过了什么吗？

1 个解决方案

跨消费者平衡负载是 Kafka 的定义功能之一，它允许水平扩展。

生产者使用的记录密钥允许它工作。 键定义了消息在哪个分区上进行，任何分区都将由一个消费者按顺序使用，因此您的生产者应该使用一种产生均匀分布的键策略，并确保相关消息在排序很重要时具有相同的键（熊请记住，如果严格订购至关重要，则在飞行请求中还有其他考虑因素）。

前者是平衡负载的方式——消费者中不涉及循环，分区只是在每个组中的消费者之间尽可能均匀地共享，并且它们独立轮询。 如果键分布良好，则每个分区将具有大致相同数量的记录。

因此，要实现有效的负载平衡，您唯一的责任就是使用一个好的策略来创建消息键，并使用至少与您计划将消费扩展到的分区一样多的分区来定义您的主题。

Kafka - 编写同一主题和消息顺序的多个制作人很重要

[英]Kafka - Multiple producers writing to same topic and order of message is important

如何列出写入某个 kafka 主题的生产者

[英]How to list producers writing to a certain kafka topic

Kafka 在同一主题和分区上与多个生产者进行排序

[英]Kafka ordering with multiple producers on same topic and parititon

使用主题模式时的负载平衡Kafka记录消耗

[英]Load balance Kafka record consumption when using topic pattern

物联网 - 多个 Kafka 生产者将消息发布到同一主题

[英]IoT - multiple Kafka producers to publish messages to same topic

在不同服务器上有多个生产者写同一主题是否可以接受？

[英]Is it acceptable to have multiple producers on different servers writing to the same topic?

Kafka如何在相同主题的同一分区上实现多次消费的并行性？

[英]How does Kafka achieve its parallelism with multiple consumption on the same topic same partition?

Kafka Producer（具有多个实例）写入同一主题

[英]Kafka Producer (with multiple instance) writing to same topic

卡夫卡多个制片人写同一主题？

[英]Kafka multiple producer writing to same topic?

在kafka上写相同的话题

[英]Writing to same topic on kafka

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Kafka - 编写同一主题和消息顺序的多个制作人很重要如何列出写入某个 kafka 主题的生产者 Kafka 在同一主题和分区上与多个生产者进行排序使用主题模式时的负载平衡Kafka记录消耗物联网 - 多个 Kafka 生产者将消息发布到同一主题在不同服务器上有多个生产者写同一主题是否可以接受？ Kafka如何在相同主题的同一分区上实现多次消费的并行性？ Kafka Producer（具有多个实例）写入同一主题卡夫卡多个制片人写同一主题？在kafka上写相同的话题

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM