簡體   English   中英

卡夫卡消費者中的重復問題

[英]Issue with duplicates in Kafka consumer

在分區 0 上測試一條 Kafka 消息,處理過程需要一個多小時。 我已經嘗試過自動提交、暫停/恢復、增加最大輪詢超時但是我無法停止消費者消息復制。 這是使用 python 的融合卡夫卡。我沒有看到一種方法來試驗異步/同步提交。

        msg= self.consumer.poll(timeout=1.0)
            if msg:
                self.consumer.pause()
                some task.. (takes ~60 minutes minutes)
                self.consumer.resume()
        except Exception as e:
            logger.error(..)

建議?

聽起來您的消費者正在重新平衡,導致您重新處理數據。 如果您至少獲得一次交付,您可以從消費者那里做很多事情來防止重復。

您應該更新您的任務以通過某些標識符從外部查找數據,從而忽略重復項。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM