簡體   English   中英

Sagemaker Model 執行 latest_execution.describe() 時出現監控錯誤

[英]Sagemaker Model Monitoring error while performing latest_execution.describe()

我正在嘗試為 Sagemaker 端點創建一個 Model 監控作業。 基線約束和統計信息已成功計算,但在安排 Monitoring Cron 作業時,我遇到了來自 Spark 的錯誤。

數據集: KC House 數據

monitor.create_monitoring_schedule(
endpoint_input=endpoint_input,
monitor_schedule_name=monitor_schedule_name,
post_analytics_processor_script=None,
output_s3_uri=monitor_report_path,
statistics=monitor.baseline_statistics(),
constraints=monitor.suggested_constraints(),
schedule_cron_expression=CronExpressionGenerator.hourly(),
enable_cloudwatch_metrics=True
)
monitor.describe_schedule()

Output:
'MonitoringScheduleStatus':'預定'

import time
executions = []
while len(executions) == 0:
print('Checking for executions...')
executions = monitor.list_executions()
time.sleep(100)



latest_execution = monitor.list_executions()[-1]
latest_execution.wait(logs=True)
latest_execution.describe()

Output:

2022-03-11 06:07:24 INFO SparkContext:54 - Successfully stopped SparkContext
2022-03-11 06:07:24 ERROR Main:97 - Job aborted due to stage failure: Task 0 in stage 2.0 failed 4 times, most recent failure: Lost task 0.3 in stage 2.0 (TID 9, algo-1, executor 1): org.json4s.package$MappingException: Do not know how to convert JArray(List(JString(bedrooms), JString(bathrooms), JString(sqft_living), JString(sqft_above), JString(grade), JString(floors), JString(view), JString(sqft_lot), JString(floors), JString(waterfront), JString(zipcode))) into class java.lang.String
#011at org.json4s.Extraction$.convert(Extraction.scala:608)
#011at org.json4s.Extraction$.extract(Extraction.scala:350)
#011at org.json4s.Extraction$$anonfun$extract$5.apply(Extraction.scala:334)
#011at org.json4s.Extraction$$anonfun$extract$5.apply(Extraction.scala:334)
#011at scala.collection.immutable.List.map(List.scala:273)
#011at org.json4s.Extraction$.extract(Extraction.scala:334)
#011at org.json4s.Extraction$.extract(Extraction.scala:42)

在這種情況下,Model 監控作業無法通過的原因可能有多種 -

  1. 假設這是針對Model 數據質量監控,我看到您正確傳遞了基線約束和統計文件參數。 我會檢查數據捕獲作業 [即本示例筆記本中的步驟 1] 是否按預期輸出 jsonl 文件。 此外,驗證基線統計數據和約束具有所有參數並在測試數據集中准確解釋它們的數據類型。

  2. 無需等待計划運行,您可以使用此代碼構造手動觸發處理作業並驗證其執行。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM