繁体   English   中英

如何检测挂起的 linux 服务?

[英]How to detect a hung linux service?

我注意到在我的一些 linux 服务器上会挂起一个 linux 服务。 我知道它挂起的唯一方法是依赖于服务的操作失败,当我重新启动服务时,它无法停止,但它开始正常。

如果我执行service <servicename> status它说它正在运行,如果我执行ps -ef | grep <servicename> ps -ef | grep <servicename>它只显示为该服务运行的一个进程是正确的。

还有什么我可以检查的以知道它是否挂了? 我正在尝试主动恢复这些服务,并确定它们挂起的原因。

作为参考,这些服务主要是 openstack-nova-compute 和 openstack-cinder-volume。 我可以用 rabbitMQ 检测到的煤渣卷服务开始建立,但同样的事情不会发生在 nova-compute 上。

这很难测试,因为就像我说的,我知道的唯一方法是,如果我尝试在 OpenStack 中的那个节点上做某事,但它失败或挂起,然后我重新启动服务。

你可以使用一些工具(一个脚本,甚至像 Nagios 这样的“真正的”监控工具)来完全按照你说的去做——模仿那些“依赖服务的操作”——这意味着尝试联系相关的服务,如果失败,将发送某种通知! (或者甚至自动重新启动它。)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM