[英]How to find from where a job is submitted in SLURM?
我通过 SLURM 向我们学校的 HPC 集群提交了几个作业。 因为 shell 脚本都具有相同的名称,所以作业名称看起来完全相同。 看起来像
[myUserName@rclogin06 ~]$ sacct -u myUserName
JobID JobName Partition Account AllocCPUS State ExitCode
------------ ---------- ---------- ---------- ---------- ---------- --------
12577766 run.sh general ourQueue_+ 4 RUNNING 0:0
12659777 run.sh general ourQueue_+ 8 RUNNING 0:0
12675983 run.sh general ourQueue_+ 16 RUNNING 0:0
我如何知道提交作业是从哪个目录中提交的,以便区分作业?
您可以使用scontrol
命令查看作业详细信息。 $ scontrol show job <jobid>
例如,对于 SLURM 集群上正在运行的作业:
$ scontrol show job 1665191
JobId=1665191 Name=tasktest
...
Shared=OK Contiguous=0 Licenses=(null) Network=(null)
Command=/lustre/work/.../slurm_test/task.submit
WorkDir=/lustre/work/.../slurm_test
您正在寻找最后一行WorkDir
。
最新版本的 Slurm 现在通过squeue
提供该信息:
squeue --format "%Z"
根据手册页显示,
%Z The job’s working directory.
为了列出不再通过squeue
或scontrol
访问的过去作业的工作目录,您可以使用sacct
:
sacct -S 2020-08-10 -u myUserName --format "jobid,jobname%20,workdir%70"
列出自 2020 年 8 月 10 日以来用户myUserName
的所有作业的作业 ID、作业名称和工作目录。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.