Kubernetes 基礎設施上的選擇性 Kafka 再平衡

Question

我在 dockerized Kubernetes 基礎設施上運行一個帶有一組消費者的 kafka 集群。 典型的工作流程是，當（消費者組的）某個消費者死亡時，將觸發重新平衡過程，並執行將分區重新分配給一組消費者（不包括失敗的消費者）。

一段時間后，Kubernetes controller 將重新創建/重新啟動失敗/死亡的消費者實例，並再次執行新的重新平衡。

有沒有辦法控制第一個重新平衡過程（當消費者死亡時），例如等待幾秒鍾而不重新平衡，直到失敗的消費者返回，或者直到觸發超時。 如果消費者返回，繼續消費基於舊的重新平衡分配（即，沒有新的重新平衡）？

Answer 1

有 3 個參數基於 group coordinator 決定消費者是死是活

session.timeout.ms
max.poll.interval.ms
heartbeat.interval.ms

您可以通過調整以上三個參數和一個拇指規則來避免不必要的重新平衡：使用單獨的線程在池循環中調用第 3 方 api。

調整以上三個參數需要 ans。 以下問題

請參考 Kafka 消費者配置

您還可以探索合作再平衡