簡體   English   中英

如何在 AWS 中搜索引發指標警報的日志?

[英]How to search for a logs that raised metric alarm in AWS?

我以以下方式配置了 AWS cloudwatch 警報表單 lambda:
命名空間:AWS/Lambda
指標名稱:錯誤
統計:總和
錯誤:5分鍾
對於靜態閾值 >= 1 的條件

觸發了警報,但我找不到導致它在日志中上升的原因,因為日志中充斥着包含“錯誤”短語的消息(記錄的屬性之一的名稱中包含“錯誤”)。

有人知道什么是 AWS 指標中的“錯誤”嗎? 或者我如何搜索導致指標上升的特定事件?

我曾嘗試通過過濾查詢那段時間的 Logs Insights

| sort @timestamp desc
| limit 20
| filter @message like /(?i)(error)/

但只收到很多看起來相同的消息,如果將它們計入指標,那么將有數千個錯誤,而不僅僅是 1 個

有人知道什么是 AWS 指標中的“錯誤”嗎?

Lambda 上下文中的“錯誤”是在完成之前引發異常的函數。 如果您捕獲異常並自行處理,則不算數。 如果您的代碼中沒有任何內容捕獲到異常,或者您自己手動引發異常,那么它會被視為錯誤。

我如何搜索導致指標上升的特定事件?

最好的方法是按時間過濾。 你知道你的警報是什么時候觸發的。 使用 Cloudwatch insights 中的時間范圍將搜索限制在警報觸發時間的幾分鍾內。

如果 Lambda 拋出異常,默認記錄器會放置[ERROR]前綴,您可以通過此查詢過濾它: filter @message like [ERROR]

如果您有自定義記錄器,則需要更新查詢。


此外,您可以使用AWS X-Ray ,它有助於跟蹤特定請求,但會產生額外費用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM