繁体   English   中英

Azure 负载均衡器运行状况探测失败

[英]Azure load balancer health probe failure

我已经浏览了这个https://docs.microsoft.com/en-us/azure/load-balancer/load-balancer-custom-probe-overview但我还没有找到答案

问题:我在 gunicorn + flask 应用程序托管的单个虚拟机上运行 tensorflow 应用程序。 目的是确保每个 VM 一次只能收到一个请求。 所以我们已经配置了我们的应用程序,在处理请求期间,如果我们收到另一个请求,我们只需发送一个 BUSY 代码(非 200 响应)..现在健康探测失败但我们不知道何时以及如何它将这个虚拟机添加回池中,因为实际上,这个虚拟机只是很忙,而且健康状况不佳..因为 azure LB 不了解在虚拟机上运行的应用程序,我们不知道如何解决这个问题

但是当我们使用上述方法时,我们看到很多超时、现有 VM 的利用率低等,这促使我们想知道“健康状况不佳”的人是否甚至被召回..azure 文档和支持真的很差..任何指针请?

根据 此处的文档,负载均衡器在第 4 层上运行,不提供应用层网关功能。 您可以尝试以下步骤以更好地了解工作流程并相应地配置您的 LB 以提高效率。

  • 您可以尝试为您的负载均衡器设置监控,并查看一些指标,例如Flow Distribution 此视图可以为您提供有关负载均衡器配置或流量模式是否导致流量不平衡的反馈。 例如,如果您配置了会话亲和性,并且单个客户端发出的请求数量不成比例。
  • 如您在上面共享的文档中所述,如果运行状况探测失败,则特定后端被标记为不健康,如果下一个运行状况探测成功,则后端被标记为健康(您提到的不健康阈值也在此处起作用)。 您可以尝试优化运行状况探测间隔,以最大限度地提高 VM 的效率。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM