簡體   English   中英

如何在 kubernetes 中模擬 pod 故障

[英]How to simulate a pod failure in kubernetes

為了對多 pod 系統進行一些穩健性測試,我需要以某種方式模擬 pod 故障。 我不想在部署中使用縮減,因為它不太現實。 在我的情況下,刪除 pod 也不是很有用,因為 pod 會在短時間內回來。

我已經檢查了以下回復: 如何在 Kubernetes 中模擬電源故障並且不符合我的需求。 有什么建議嗎?

您可以查看這個名為Chaos Mesh 的工具。

這有 Pod 故障、網絡故障、創建壓力、IO 混亂等選項。 Chaos 網格是專門為 Kubernetes 及其開源設計的。

還有另一個很棒的工具叫做Litmus 這也是專為 Kubernetes 設計的。

為了模擬網絡問題,我建議關閉節點之一或弄亂它的 IP 地址,使其無法訪問。

另一種方法是模擬max out resources 您可以exec進入一個 pod 並運行一些會消耗大量資源(CPU、RAM)的東西,同時為它們設置限制。 或者,您可以設置低於實際使用量的限制。

您還可以設置探針並模擬它們的故障。 失敗的Liveness探測將強制重新啟動 pod。

最后,您還可以檢查Chaos Controller 它為混沌測試提供控制器,並支持 irch 故障場景集。

也許您可以強調內存使用情況,以便它會因 OOM 問題而被殺死。 並嘗試殺死在容器內運行的主進程,該進程也將重新啟動 pod。 我建議的最后一個選項是配置錯誤的活躍度和就緒度探測器。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM