繁体   English   中英

如何在失败时捕获 sagemaker 错误并通过 SES、SNS 通知

[英]How to capture the sagemaker error in case it fails and notify via SES,SNS

我有一个 lambda function 创建了一个 sagemaker 处理作业。 现在假设 sagemaker 作业由于算法错误或 API 错误等而失败,我如何捕获确切的错误消息(例如,参见图片)并从同一个 lambda function发送email 或者它可以是一个单独的事件?

https://anonfiles.com/d308Jf15ue/2021-06-17_22_36_21-Amazon_SageMaker_png

这就是我所做的。 我使用 cloudwatch 事件进行监控,在事件规则目标中,我给了 SNS 主题,我的 email 订阅了这个主题。 这是我使用的事件模式。

 { "source": ["aws.sagemaker"], "detail-type": ["SageMaker Processing Job State Change"], "detail": { "ProcessingJobStatus": ["Failed"] } }

Cloud watch 事件目标还有输入转换器,您可以在其中从接收到的 cloudtrail 事件中获取数据并将其传递给 SNS。事件数据应该包含错误消息。

https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/CloudWatch-Events-Input-Transformer-Tutorial.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM