SLURM sbatch 是否自动跨节点复制用户脚本？

Question

SLURM（特别是sbatch）是否应该自动将用户脚本（不是作业配置脚本）复制到集群的计算节点执行？ 从我的登录节点执行 sbatch 文件后，输出文件是在我的一个计算节点上创建的，但包含以下内容：

ERROR: could not open file /home/pi/slurm.jl
Stacktrace:
 [1] include at ./boot.jl:328 [inlined]
 [2] include_relative(::Module, ::String) at ./loading.jl:1105
 [3] include(::Module, ::String) at ./Base.jl:31
 [4] exec_options(::Base.JLOptions) at ./client.jl:287
 [5] _start() at ./client.jl:460

我正在使用sbatch julia.sbatch运行批处理脚本。

朱莉娅.sbatch：

#!/bin/bash
#SBATCH --nodes=4
#SBATCH --ntasks=4
#SBATCH --time=00:15:00
#SBATCH --output=julia.out
#SBATCH --job-name=julia-job

julia slurm.jl

或者脚本 (slurm.jl) 应该位于所有节点都可以访问的共享存储上吗？

Answer 1

Slurm 不会将提交脚本以外的文件复制到计算节点。 从快速入门用户指南：

Slurm 不会自动将可执行文件或数据文件迁移到分配给作业的节点。 文件必须存在于本地磁盘或某些全局文件系统（例如 NFS 或 Lustre）中。

在大多数集群上， /home目录是在每个登录节点和计算节点上共享的 NFS 文件系统。

Answer 2

您可以在脚本中使用sbcast将文件复制到节点。

#!/bin/bash
#SBATCH --nodes=4
#SBATCH --ntasks=4
#SBATCH --time=00:15:00
#SBATCH --output=julia.out
#SBATCH --job-name=julia-job
sbcast slurm.jl slurm.jl
julia slurm.jl

SLURM sbatch 是否自动跨节点复制用户脚本？

问题描述

2 个解决方案

解决方案1
2 已采纳 2019-12-27 22:38:21

解决方案2
0 2021-11-05 10:18:15

SLURM sbatch 是否自动跨节点复制用户脚本？

问题描述

2 个解决方案

解决方案1 2 已采纳 2019-12-27 22:38:21

解决方案2 0 2021-11-05 10:18:15

解决方案1
2 已采纳 2019-12-27 22:38:21

解决方案2
0 2021-11-05 10:18:15