簡體   English   中英

訪問 AWS SageMaker 筆記本中的實例存儲

[英]Accessing instance storage in AWS SageMaker notebooks

我正在嘗試使用 AWS SageMaker 筆記本訓練 model,但我對 model 的訓練速度很慢感到失望。 我認為我的瓶頸在於我的 SageMaker 筆記本為數據集訪問的持久性存儲(EFS 和 EBS)的 IOPS 速度。

首先,我嘗試在 SageMaker Studio ml.g4dn.xlarge 實例上進行訓練,然后通過 Jupyter 將所有內容移至 SageMaker notebook ml.g4dn.xlarge 實例。 盡管 g4dn.xlarge 實例帶有物理連接的 125GB SSD,但我無法訪問它,因為 SageMaker Studio 會自動創建一個 EFS 存儲,而 SageMaker 筆記本實例會自動創建一個 EBS 存儲。 我如何將我的數據集存儲在 125GB SSD 而不是 EFS 或 EBS 上以加快 IOPS?

很明顯,有memory 的實例針對大量數據進行了優化 在您的情況下,如果數據集作為輸入提供給 model 且大小正好相同(因此沒有上游預處理來減輕這一數據量),您必須知道g4dn 是 EBS optimized

我能想到的最明顯的答案是使用 S3 存儲桶

來自“ Amazon EC2 和 Amazon S3 之間的最大傳輸速度”:

Amazon EC2 和 Amazon S3 之間的流量可以利用高達 100 Gbps 的帶寬連接到同一區域中的 VPC 終端節點和公共 IP。

除了非常快速和高性能之外,就 AWS 上項目的所有組件的設計而言,它也是最佳解決方案。 顯然,它需要不同的成本和不同的架構,但您將享受到 AWS 服務集可以為您提供的最大速度(並且可能需要特殊配置以獲得更好的性能)。

我的建議是遵循AWS 從頭開始開發復雜項目的指南構建、訓練和部署機器學習模型

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM