簡體   English   中英

在 aws sagemaker 中使用外部庫進行模型訓練

[英]Using external libraries for model training in aws sagemaker

我剛開始使用 aws sagemaker 並意識到它沒有隨機森林分類器。 我在 sagemaker 中找到了有關創建自己的並將其部署的 github 教程: https ://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-python-sdk/scikit_learn_randomforest/Sklearn_on_SageMaker_end2end.ipynb。

我正在使用 python sdk,並且或多或少地好奇是否有人真正使用它或任何外部庫來使用 sagemaker 進行培訓。 似乎如果您不使用內置算法,那么創建您自己的算法非常復雜,並且一旦您接受了訓練,模型的功能和解釋它的能力就非常有限。

例如,在將模型部署到 aws 端點並拉下工件后,我只能調用predict方法(在實際sklearn randomforestclassifier predict_probab可能沒有 predict_probab )。 我也找不到像你在sklearn.metrics中得到的東西,比如accuracy_score, roc_auc_score, precision_score, recall_score, f1_score, confusion_matrix等,所以我假設需要從頭開始構建這些等價物才能能夠解釋他們的模型。

我花了一個星期左右的時間研究這個並試圖把它安裝起來,似乎在 sagemaker 中導入外部庫進行模型訓練並不是很受歡迎或在網上有很好的記錄。 有興趣知道我是否只是不知道更多功能,或者是否有人們更喜歡的替代方案,或者如果我正在尋找基於樹的選項,我是否應該堅持使用內置的 xgboost 分類器。 謝謝。

使用任何框架容器(例如 SKLearn)時,可以添加額外的訓練包。 請參閱此鏈接以獲取更多信息。

從托管的角度來看,您確實能夠提供自定義 entry_point / inference.py 腳本,您可以使用它來控制模型加載、預處理和后處理。 請參閱此鏈接以獲取更多信息

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM