簡體   English   中英

如何檢測掛起的 linux 服務?

[英]How to detect a hung linux service?

我注意到在我的一些 linux 服務器上會掛起一個 linux 服務。 我知道它掛起的唯一方法是依賴於服務的操作失敗,當我重新啟動服務時,它無法停止,但它開始正常。

如果我執行service <servicename> status它說它正在運行,如果我執行ps -ef | grep <servicename> ps -ef | grep <servicename>它只顯示為該服務運行的一個進程是正確的。

還有什么我可以檢查的以知道它是否掛了? 我正在嘗試主動恢復這些服務,並確定它們掛起的原因。

作為參考,這些服務主要是 openstack-nova-compute 和 openstack-cinder-volume。 我可以用 rabbitMQ 檢測到的煤渣卷服務開始建立,但同樣的事情不會發生在 nova-compute 上。

這很難測試,因為就像我說的,我知道的唯一方法是,如果我嘗試在 OpenStack 中的那個節點上做某事,但它失敗或掛起,然后我重新啟動服務。

你可以使用一些工具(一個腳本,甚至像 Nagios 這樣的“真正的”監控工具)來完全按照你說的去做——模仿那些“依賴服務的操作”——這意味着嘗試聯系相關的服務,如果失敗,將發送某種通知! (或者甚至自動重新啟動它。)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM