簡體   English   中英

對於Kubernetes資源請求/限制,該放置什么?

[英]What to put for Kubernetes resource requests/limits?

我看過一些文章,建議實施資源請求/限制。 然而,沒有我發現在填寫什么數字,討論。

例如,假設一個容器在空閑狀態下使用零CPU,在正常用戶請求下使用80%的CPU,在遇到一些罕見請求時使用200%的CPU:

  • 如果我將2000m作為CPU請求的最大值,則大多數情況下內核將處於空閑狀態
  • 另一方面,如果我請求800m,並且同時有多個Pod達到其CPU限制,則上下文切換開銷將增加

也有類似的情況

  • 內部工具大部分時間處於閑置狀態,然后在主動使用時跳升至200%
  • 高峰時間不同的應用。 例如,人們在工作時間內使用的SaaS,而聊天機器人則在人們下班后開始增加負載。 如果他們可以共享未使用的容量,那就太好了。

理想情況下, 垂直吊艙自動定標器可能會自動解決這些問題,但是今天它仍然處於alpha狀態。

我一直在做的事情是使用Telegraf收集資源使用情況,並使用第95個百分位數,同時將限制設置為1個CPU和兩倍的內存請求。

截圖

這種方法的問題是

  • 在啟動過程中使用多核的應用程序,然后在其整個生命周期中處於核心之下將需要更長的時間才能啟動。 我觀察到2分鍾的春天啟動就變成5分鍾
  • 很少使用的應用程序將保留較少的資源,因此在調用時必須依靠突發容量。 如果它的受歡迎程度激增,這可能是個問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM