AWS EC2 Cloudwatch監控

Question

首先，感謝您在閱讀和思考此問題時的耐心。

我在一個AWS EC2實例（Ubuntu 14.04）上遇到了一個獨特的問題，該實例只能通過http或ping無法訪問。 這也使我無法使用ssh訪問。 我必須每次都登錄到aws控制台，然后手動重新啟動實例。 作為解決方案，我已將cloudwatch監控配置為在系統檢查失敗的任何情況下自動重新啟動實例並向我發送通知電子郵件。

到現在為止還挺好。

現在，我真正想要的是實例無法到達的根本原因。 我認為這是一個內存問題。 我瀏覽了get-system-logs，這有所幫助。 但是，無論如何，我可以將cloudwatch配置為在向我發送警報電子郵件時向我發送失敗日志或類似內容。 還是有什么辦法，當實例無法訪問時，我可以用足夠的日志信息來提醒自己，例如-內存使用率為80％，網絡沒有響應等。 我聽說過交換工具，但是我正在尋找更通用的工具，而不僅限於內存監視。

有什么事嗎 有人知道嗎？

Answer 1

我會很老套，並使用服務器上的腳本登錄到文件

大概（您在上面沒有提到此詳細信息）系統上正在運行某個特定程序，該程序會給您帶來此問題

通常，系統程序將其PID存儲在文件中。 假設文件為/var/run/nginx.pid。 您可以為您的特定系統解決這個問題

編寫腳本以讀取PID並記錄內存使用情況，例如，將該文件添加為“ / usr / local / bin / mymemory”

PID=`cat /var/run/crond.pid`
# the 3 fields are %mem, VSZ and RSS
DATA=`ps uhp $PID| awk '{print $4, $5, $6}'`
NOW=`date --rfc-3339=sec`
echo "$NOW $DATA" >> /var/log/memory.log

以root身份向crontab添加一行

* * * * * /usr/local/bin/mymemory.log

這將使每分鍾的內存文件不斷增長。 我建議您每天登錄一次並檢查一下，如果有興趣請下載並刪除。 （在實際生產環境中，可以使用日志輪換）

每次崩潰時，文件應包含內存使用數據

AWS EC2 Cloudwatch監控

問題描述

1 個解決方案

解決方案1
0 2017-11-14 14:05:26

AWS EC2 Cloudwatch監控

問題描述

1 個解決方案

解決方案1 0 2017-11-14 14:05:26

解決方案1
0 2017-11-14 14:05:26