簡體 English 中英

在 AWS GPU Graviton 實例上運行 Triton 服務器推理

[英]Running Triton Server Inference on AWS GPU Graviton instance

原文 2022-10-21 10:35:55 2 1 amazon-web-services/ gpu/ nvidia/ inference/ tritonserver

我目前正在使用標准的 GPU 啟用的 EC2（非常昂貴）在 AWS 雲上的生產環境中運行Triton 服務器。

我已經看到這些啟用了 GPU 的新 Graviton 實例的運行成本可以降低 40%。 但是，它們在 ARM（不是 AMD）上運行。 這是否意味着我可以在此實例上運行標准版本的 Triton 服務器？

查看Triton服務器發行說明，我看到它可以在jetson nano上運行，它是nvidia gpu ARM https://github.com/triton-inference-server/server/releases/tag/v1.12.0

這種方法會降低我的成本嗎？ 我可以在這些引力子實例上運行 Triton 服務器嗎？

使用這些實例性能會下降嗎？

1 個解決方案

查看Nvidia 的 NGC 容器存儲庫，可以看到為最新版本的 Arm64 構建的容器。 從表面上看，它應該適用於 G5g。 我建議您試用容器並測試它是否適合您的需要。 如果不測試您的特定工作負載，就不可能預先知道性能如何，也無法知道它是否更便宜。

用於 SageMaker 推理的 NVIDIA Triton 與 TorchServe

[英]NVIDIA Triton vs TorchServe for SageMaker Inference

如何在 AWS EC2 實例上激活 GPU 的使用？

[英]How to activate the use of a GPU on AWS EC2 instance?

Cronjob 腳本不適用於在 EBS 卷上啟用加密的基於 Graviton 的 EC2 實例

[英]Cronjob Script not working for Graviton based EC2 instance with encryption enabled on EBS volume

在 AWS 實例上運行 EXE 以進行游戲托管

[英]Running an EXE on an AWS Instance for game hosting

查找 AWS 實例運行的是 Amazon Linux 1 還是 2？

[英]Find if AWS instance is running Amazon Linux 1 or 2?

終止 AWS EC2 實例失敗 - 實例仍在運行

[英]Terminating AWS EC2 instance fails - the instance is still running

如何檢查我是否在 GCP / AWS 實例上運行代碼？

[英]How to check whether if I'm running the code on a GCP / AWS instance?

AWS Ec2 Ubuntu 實例運行 Angular 14 App

[英]AWS Ec2 Ubuntu Instance Running Angular 14 App

AWS ECS：無法連接到在 EC2 實例中運行的網絡服務器

[英]AWS ECS: Cannot connect to webserver running in EC2 instance

AWS Sagemaker 錯誤 INVALID_INFERENCE_TYPE

[英]AWS Sagemaker error INVALID_INFERENCE_TYPE

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 用於 SageMaker 推理的 NVIDIA Triton 與 TorchServe 如何在 AWS EC2 實例上激活 GPU 的使用？ Cronjob 腳本不適用於在 EBS 卷上啟用加密的基於 Graviton 的 EC2 實例在 AWS 實例上運行 EXE 以進行游戲托管查找 AWS 實例運行的是 Amazon Linux 1 還是 2？終止 AWS EC2 實例失敗 - 實例仍在運行如何檢查我是否在 GCP / AWS 實例上運行代碼？ AWS Ec2 Ubuntu 實例運行 Angular 14 App AWS ECS：無法連接到在 EC2 實例中運行的網絡服務器 AWS Sagemaker 錯誤 INVALID_INFERENCE_TYPE

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM