简体   繁体   English

过度订阅GPU

[英]Slurm oversubscribe GPUs

Is there a way to oversubscribe GPUs on Slurm, ie run multiple jobs/job steps that share one GPU? 有没有一种方法可以在Slurm上超额订购GPU,即运行共享一个GPU的多个作业/作业步骤? We've only found ways to oversubscribe CPUs and memory, but not GPUs. 我们仅找到了超额订购CPU和内存的方法,而未找到GPU。

We want to run multiple job steps on the same GPU in parallel and optionally specify the GPU memory used for each step. 我们要在同一GPU上并行运行多个作业步骤,并可以选择指定每个步骤使用的GPU内存。

这样做的最简单的方法是有定义为GPU的feature而不是作为一个gres所以SLURM不会管理的GPU,只要确保工作需要的,提供一个节点一个土地。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM