繁体 English 中英

Kafka主题或分区级别的并行性

[英]Parallelism at Kafka Topics or Partitions Level

原文 2015-09-15 08:08:41 4 2 message-queue/ apache-kafka/ messagebroker/ kafka-python

为了分隔数据，请基于一个关键点：我应该在同一个主题内使用多个主题还是多个分区？ 我问的基础上的开销，计算，数据存储和服务器上造成的负载。

2 个解决方案

我建议您将数据划分（分区）为同一主题内的多个分区。 我假设数据在逻辑上属于在一起（例如，单击事件流）。 在同一个主题内使用多个分区对数据进行分区的优势主要是，所有Kafka API均实现为像这样使用。

将数据拆分为主题可能会在生产者和消费者实现中带来更多代码。

正如@rmetzger所建议的，将记录分成多个主题会增加生产者级别的复杂性，但是可能还有其他一些因素值得考虑。

在Kafka中，并行性的主要级别是一个主题中的分区数量，因为有了它，您可以产生许多数量的使用者实例，以保持并行读取同一主题中的数据。

例如，如果您基于具有N个分区的事件而有一个单独的主题，那么在使用时，您将能够创建N个使用方实例，每个专用于同时从特定分区进行使用。 但是在那种情况下，不能保证消息的顺序。即，在存在并行消耗的情况下，消息的顺序会丢失

另一方面，将同一主题内的记录保存在单独的分区中将使此操作更容易实现，并且可以按顺序使用消费者消息（ Kafka仅按分区内的消息（而不是主题中不同分区之间的消息）提供总顺序。 ） 但是在这种情况下，您将只能运行一个使用者进程。

Kafka：单消费者组，无分区多主题

[英]Kafka: Single consumer group, no partitions and multiple topics

设计 Kafka 主题 - 许多主题与一个大主题

[英]Desigining Kafka Topics - Many Topics vs One Big Topic

是否可以使用 AVRO 为 Kafka 中的 Google Pub/Sub 主题定义模式？

[英]Is it possible to define a schema for Google Pub/Sub topics like in Kafka with AVRO?

Kafka - 如何在使用高级消费者的每条消息后提交偏移量？

[英]Kafka - How to commit offset after every message using High-Level consumer?

消息队列：多个主题与带过滤器的通用主题

[英]Message Queues: Multiple Topics vs Generic Topics with Filters

数百万个主题的消息排队解决方案

[英]Message queuing solution for millions of topics

使用 MQTT 和 Solace 限制/保护主题

[英]Restricting / Protecting Topics with MQTT and Solace

消费者如何处理服务总线主题？

[英]How do consumers work with service bus topics?

我可以使用 Celery 发布和订阅主题吗？

[英]Can I use Celery for publishing and subscribing to topics?

我在ZeroMQ上最多可以拥有多少个主题？

[英]What's the max of topics I can have on ZeroMQ?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Kafka：单消费者组，无分区多主题设计 Kafka 主题 - 许多主题与一个大主题是否可以使用 AVRO 为 Kafka 中的 Google Pub/Sub 主题定义模式？ Kafka - 如何在使用高级消费者的每条消息后提交偏移量？消息队列：多个主题与带过滤器的通用主题数百万个主题的消息排队解决方案使用 MQTT 和 Solace 限制/保护主题消费者如何处理服务总线主题？我可以使用 Celery 发布和订阅主题吗？我在ZeroMQ上最多可以拥有多少个主题？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM