簡體 English 中英

如何動態擴展Kafka流處理？

[英]How to scale Kafka stream processing dynamically?

原文 2019-05-16 18:21:57 1 1 java/ python/ apache-kafka/ kafka-consumer-api

我有一個固定數量的主題分區。 生產者在一天中的不同時間以不同的速率生產數據。

我想根據一天中的小時動態地添加消費者，以便可以盡快處理記錄。

例如，我有一個主題的10個分區。 我想在非高峰時段部署5個消費者，在高峰時段部署20個消費者。

我的問題是，當我有20個消費者時，每個消費者都將收到重復的記錄，這是我想避免的。 我只想處理唯一記錄，以加快記錄處理速度。

有什么機制可以做到這一點嗎？

1 個解決方案

如果您有N個分區，則在同一使用者組中最多可以有N個使用者，每個使用者都從一個分區讀取。 當使用者少於分區時，某些使用者將從多個分區中讀取數據。 另外，如果您的使用者數量大於分區數量，則某些使用者將處於非活動狀態，並且根本不會收到任何消息。

因此，如果要啟動20個使用者，則需要將主題的分區數增加到至少20個，否則，您的10個使用者將處於非活動狀態。

關於您提到的重復項 ，如果所有使用者都屬於同一組，則每條消息將只使用一次。

總而言之，

將主題的分區數增加到20。
創建一種機制，該機制將根據高峰/非高峰時間創建並殺死消費者，並確保在您踢消費者時，它屬於現有的消費者組，因此消息僅被消費一次。

如何在Flink Kafka Consumer中動態獲取處理中的Kafka主題名稱？

[英]How to get the processing kafka topic name dynamically in Flink Kafka Consumer?

如何使用 Kafka Streams 和 Spring Kafka Streams 定期（每 5 分鍾）暫停和恢復 stream 處理？

[英]How can I pause and resume stream processing periodically(every 5 minutes) using Kafka Streams and Spring Kafka Streams?

如果在處理步驟中發生故障，如何使 Spring 雲 stream Kafka 流活頁夾重試處理消息？

[英]How to make Spring cloud stream Kafka streams binder retry processing a message if a failure occurs during the processing step?

如何使用 Spring Cloud Stream 和 Kafka Streams Binder 暫停（打開/關閉）stream 處理？

[英]How can I pause (turn on/off) stream processing w/ Spring Cloud Stream & Kafka Streams Binder?

Apache Flink Kafka Stream 根據條件處理

[英]Apache Flink Kafka Stream Processing based on conditions

當消費者制造瓶頸（高消息處理時間）時，如何擴展 kafka 消息消費？

[英]How to scale kafka message consumption when consumers create bottleneck (high message processing time)?

Kafka Streams | 如何根據流接收的內容動態添加“ to”主題

[英]Kafka Streams | How to add the “to” topic dynamically on the basis of content received over stream

在Kafka Stream中處理消息時發生錯誤時重新處理消息

[英]Reprocessing a message when an error occurs while processing it in the Kafka Stream

如何比較Kafka中的stream記錄

[英]How to compare stream records in Kafka

如何重新處理批量Kafka流

[英]How to reprocess a batched Kafka Stream

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在Flink Kafka Consumer中動態獲取處理中的Kafka主題名稱？如何使用 Kafka Streams 和 Spring Kafka Streams 定期（每 5 分鍾）暫停和恢復 stream 處理？如果在處理步驟中發生故障，如何使 Spring 雲 stream Kafka 流活頁夾重試處理消息？如何使用 Spring Cloud Stream 和 Kafka Streams Binder 暫停（打開/關閉）stream 處理？ Apache Flink Kafka Stream 根據條件處理當消費者制造瓶頸（高消息處理時間）時，如何擴展 kafka 消息消費？ Kafka Streams | 如何根據流接收的內容動態添加“ to”主題在Kafka Stream中處理消息時發生錯誤時重新處理消息如何比較Kafka中的stream記錄如何重新處理批量Kafka流

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM