簡體   English   中英

Kafka集群通過ansible重啟

[英]Kafka cluster restart via ansible

重新啟動作為集群一部分的所有 kafka 服務器的建議方法是什么?

問題的本質是因為我們通過ansible管理它,並且我們有關於例如 server.properties 的更改的notify ,因此重啟將同時發生。

通常當代理消失時,數據會重新平衡,所以我想知道如果所有代理同時重新啟動會發生什么。

以合理的方式重新啟動應用程序是一個棘手的話題。 要使其工作,您需要收集要求:

  • 更好的是 - 單次重啟可能不會重啟(最多一次)或保證重啟可能多次重啟(至少一次)
  • 如何檢測節點是否可以重新啟動?

根據第一個問題,您可能希望使用文件標志(在 /tmp 中)來指示重啟正在掛起(如果 playbook 在中間失敗,則使用此標志作為應用程序重啟的持久存儲)。

對於第二個問題,最好的方法是查詢 Ansible 之外的內容(例如某些 API 服務器、監控服務器等)以查看是否允許重新啟動。

最安全和最慢的方法是在重啟節點之前使用serial: 1和多次檢查運行重啟劇本。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM