[英]How to know the status of each process of one job in the slurm cluster manager?
只需使用sacct
随附的命令sacct。
鉴于此代码( my.sh
):
#!/bin/bash
#SBATCH --nodes=1
#SBATCH --ntasks=2
srun -n1 sleep 10 &
srun -n1 sleep 3
wait
我运行它:
sbatch my.sh
然后用sacct
检查它:
sacct
这给了我每步信息:
JobID JobName Partition Account AllocCPUS State ExitCode
---------- ---------- ---------- ---------- ---------- ---------- --------
8021 my.sbatch CLUSTER me 2 RUNNING 0:0
8021.0 sleep me 1 RUNNING 0:0
8021.1 sleep me 1 COMPLETED 0:0
sacct
有很多选项可以自定义其输出。 例如,
sacct --format='JobID%6,State'
只会提供您的ID(最多6个字符)和作业的当前状态:
JobID State
------ ----------
8021 RUNNING
8021.0 RUNNING
8021.1 COMPLETED
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.