[英]Slurm oversubscribe GPUs
有沒有一種方法可以在Slurm上超額訂購GPU,即運行共享一個GPU的多個作業/作業步驟? 我們僅找到了超額訂購CPU和內存的方法,而未找到GPU。
我們要在同一GPU上並行運行多個作業步驟,並可以選擇指定每個步驟使用的GPU內存。
這樣做的最簡單的方法是有定義為GPU的feature
而不是作為一個gres
所以SLURM不會管理的GPU,只要確保工作需要的,提供一個節點一個土地。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.