[英]Are Kubernetes liveness probe failures voluntary or involuntary disruptions?
[英]involuntary disruptions / SIGKILL handling in microservice following saga pattern
我應該設計我的微服務來處理硬件故障等非自願中斷嗎? 這些中斷是否頻繁到足以在 AWS 托管 EKS 集群上運行的服務中處理。
我是否應該考慮在服務中進行一些設計更改以使用諸如在每個步驟中持久化數據之類的方法來處理意外的 SIGKILL,還是將其視為過度工程?
如果是,您會建議什么標准方法來處理這些非自願中斷
a) 一個安靜的服務,通常在 1 秒內響應(遵循 saga 模式)。 b) 在 1 小時內處理 1GB 大文件的服務。
有幾種方法可以處理這些中斷。 如此處所述:
以下是一些減輕非自願干擾的方法:
- 確保您的 pod 請求它需要的資源。
- 如果您需要更高的可用性,請復制您的應用程序。 (了解如何運行復制的無狀態和有狀態應用程序。)
- 為了在運行復制的應用程序時獲得更高的可用性,請將應用程序分布在機架之間(使用反關聯)或跨區域(如果使用多區域集群)。
自願中斷的頻率各不相同。
所以:
SIGKILL
時,負載會自動定向到另一個 Pod。 您可以在此處閱讀有關此內容的更多信息。我希望我為您清理了一點水,請隨時提出更多問題。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.