当 Kubernetes 活跃度探测失败时，是否可以指定 Pod 重启的延迟？

Question

得到了一个简单的 REST API 服务器，使用 python gunicorn 构建，它运行多个线程来接受请求。 运行一段时间后，其中一些线程崩溃。 有一个脚本来检测死线程的数量（使用日志文件）。 一旦这个数字超过某个阈值，我们就想重新启动 gunicorn。 此脚本配置为用作liveness probe 。

该脚本工作正常并按预期重新启动 pod。 但是有一些活动线程仍在处理请求。 此外，gunicorn 保留了一个它无法处理的已接受请求的积压队列，因为其他请求正在处理中。 有没有办法指定 pod 重启的延迟，以便其他正在运行的线程和积压请求有一些时间来完成处理？

Answer 1

您可以使用 prestop 挂钩。 官方文档在这里

如何使用记录在这里。

您还可以使用 terminateGracePeriodSeconds 来允许优雅地终止 pod。

最佳实践在这里

Answer 2

您可以使用 terminateGracePeriodSeconds 配置优雅的 pod terminationGracePeriodSeconds

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
    name: test
spec:
    replicas: 1
    template:
        spec:
            containers:
              - name: test
                image: ...
            terminationGracePeriodSeconds: 60

当 Kubernetes 活跃度探测失败时，是否可以指定 Pod 重启的延迟？

问题描述

2 个解决方案

解决方案1
3 已采纳 2020-07-28 16:03:20

解决方案2
1 2020-07-28 16:04:44

当 Kubernetes 活跃度探测失败时，是否可以指定 Pod 重启的延迟？

问题描述

2 个解决方案

解决方案1 3 已采纳 2020-07-28 16:03:20

解决方案2 1 2020-07-28 16:04:44

解决方案1
3 已采纳 2020-07-28 16:03:20

解决方案2
1 2020-07-28 16:04:44