我有一个简单的 test.ksh,我正在使用以下命令运行:
批量测试.ksh
我不断收到“JobState=FAILED Reason=NonZeroExitCode”(使用“scontrol show job”)
我已经确定了以下几点:
- slurmd 和 slurmctld 已启动并正常运行
- “test.ksh”的用户权限是 777。
- 命令“srun test.ksh”(本身,不使用 sbatch)成功没有问题
- 我尝试在“test.ksh”的最后一行输入“return 0”,但没有成功
- 我尝试在“test.ksh”的最后一行输入“exit 0”,但没有成功
- 我尝试在“test.ksh”的最后一行输入“主机名”,但没有成功
- 我尝试在“test.ksh”的最后一行输入“srun hostname”,但没有成功