[英]Long running service check in Nagios
我在Nagios Exchange網站上找到了一項服務檢查,該服務檢查對於小型目錄效果很好,但對於耗時超過30或60秒才能完成的較大目錄來說效果不佳。
我遇到的問題是,我需要配置服務檢查,以確保Nagios每天可以運行一次,但將保持1440分鍾(一天)開放。 目錄列表很大,需要花費許多小時才能完成(最多20小時)。
這是我的服務檢查(每天檢查一次,使用nrpe時,超時為86400秒,這也是一天)。 但是由於某些原因,即使我可以在ps -ef |命令行中看到du -sk運行 grep du,Nagios正在報告“(服務檢查超時)”:
define service {
use generic-service,srv-pnp
host_name IMAGEServer1
service_description Images
check_command check_nrpe!check_dirsize -t 86400
check_interval 1440
}
在Linux服務器上的nrpe.cfg文件中,我也有以下兩個指令:
command_timeout=86400
connection_timeout=86400
如何讓Nagios完成檢查而不超時? 我的印象是上面的指令是正確的。
超時是本地的check_nrpe
命令(默認超時為2分鍾)。 您可以編輯其命令定義以使用較長的超時時間。
另外,您可能想作為IMAGEServer1上的被動檢查來執行此操作,它作為cron作業運行。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.