當 Kubernetes 活躍度探測失敗時，是否可以指定 Pod 重啟的延遲？

Question

得到了一個簡單的 REST API 服務器，使用 python gunicorn 構建，它運行多個線程來接受請求。 運行一段時間后，其中一些線程崩潰。 有一個腳本來檢測死線程的數量（使用日志文件）。 一旦這個數字超過某個閾值，我們就想重新啟動 gunicorn。 此腳本配置為用作liveness probe 。

該腳本工作正常並按預期重新啟動 pod。 但是有一些活動線程仍在處理請求。 此外，gunicorn 保留了一個它無法處理的已接受請求的積壓隊列，因為其他請求正在處理中。 有沒有辦法指定 pod 重啟的延遲，以便其他正在運行的線程和積壓請求有一些時間來完成處理？

Answer 1

您可以使用 prestop 掛鈎。 官方文檔在這里

如何使用記錄在這里。

您還可以使用 terminateGracePeriodSeconds 來允許優雅地終止 pod。

最佳實踐在這里

Answer 2

您可以使用 terminateGracePeriodSeconds 配置優雅的 pod terminationGracePeriodSeconds

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
    name: test
spec:
    replicas: 1
    template:
        spec:
            containers:
              - name: test
                image: ...
            terminationGracePeriodSeconds: 60

當 Kubernetes 活躍度探測失敗時，是否可以指定 Pod 重啟的延遲？

問題描述

2 個解決方案

解決方案1
3 已采納 2020-07-28 16:03:20

解決方案2
1 2020-07-28 16:04:44

當 Kubernetes 活躍度探測失敗時，是否可以指定 Pod 重啟的延遲？

問題描述

2 個解決方案

解決方案1 3 已采納 2020-07-28 16:03:20

解決方案2 1 2020-07-28 16:04:44

解決方案1
3 已采納 2020-07-28 16:03:20

解決方案2
1 2020-07-28 16:04:44