[英]Change CPU count for RUNNING Slurm Jobs
我有一个SLURM集群和一个RUNNING作业,在该作业中,我已请求60个线程
#SBATCH --cpus-per-task=60
(我正在使用cgroups在节点上共享线程)
我现在想将线程数减少到30。
$ scontrol update jobid=274332 NumCPUs=30
Job is no longer pending execution for job 274332
该作业仍分配了60个线程。
$ scontrol show job 274332
JobState=RUNNING Reason=None Dependency=(null)
NumNodes=1 NumCPUs=60 NumTasks=1 CPUs/Task=60 ReqB:S:C:T=0:0:*:*
如何做到这一点的正确方法?
谢谢!
在当前版本的Slurm中, scontrol
仅允许减少分配给正在运行的作业的节点数,而不能减少CPU(或内存)数。
常见问题解答说:
使用scontrol命令来更改作业的大小,方法是为作业指定新的节点数(NumNodes =) ,或者标识要保留作业的特定节点(NodeList =) 。
(强调我的)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.