0

我想同时从多个目录中执行一个 SLURM脚本。更具体地说,我有十个编号的数组文件夹array_1array_10我想从中执行脚本。在每个目录中,脚本创建 10 个子目录,标记为${SLURM_ARRAY_TASK_ID}_ztag。但是,我必须从十个 array_ 目录中的每个目录中手动执行 SLURM 脚本。当我必须一遍又一遍地这样做时,这变得很麻烦。

通常,使用 shell 脚本,这将是一个简单的for循环,但因为#SBATCH不是由 bash 解释,所以我没有任何成功。当前脚本(在每个数组文件夹中单独运行)是:

#!/bin/bash
#SBATCH -o <some_thing>.o%j 
#SBATCH --time=<time> #specify the time
#SBATCH --array=1-10 #ten arrays

#SBATCH -c 1
#SBATCH -C dodeca96gb
#SBATCH --mem=<memory>

echo "SLURM_JOBID: " $SLURM_JOBID
echo "SLURM_ARRAY_TASK_ID: " $SLURM_ARRAY_TASK_ID
echo "SLURM_ARRAY_JOB_ID: " $SLURM_ARRAY_JOB_ID

mkdir ${SLURM_ARRAY_TASK_ID}_ztagA #creates 10 subdirs w/i ea. array
cd ${SLURM_ARRAY_TASK_ID}_ztagA

$ROSETTA3BIN/bin/rna_denovo.default.linuxgccrelease -s ./<dir>/*pdb -nstruct 100 -fasta ./<fastafile>.fasta -secstruct_file ./<dot-brackets>.secstruct

然后我键入sbatch <filename>.slurm,脚本从执行脚本的任何目录中创建子目录,因此需要该cd行,因此要同时从所有十个数组中执行它是很棘手的。我尝试了以下各种组合:

#!/bin/bash
#SBATCH --array=1-10
#SBATCH --chdir=./array_%a
#SBATCH -o ./array_%a/<some_thing>.o%j #STDOUT
#SBATCH --time=<time>

#SBATCH -c 1
#SBATCH -C dodeca96gb
#SBATCH --mem=<memory>

echo "SLURM_JOBID: " $SLURM_JOBID
echo "SLURM_ARRAY_TASK_ID: " $SLURM_ARRAY_TASK_ID
echo "SLURM_ARRAY_JOB_ID: " $SLURM_ARRAY_JOB_ID

for i in {1..10}
do
    mkdir -p ./array_${i}/${SLURM_ARRAY_TASK_ID}_ztagA
    cd ./array_${i}/${SLURM_ARRAY_TASK_ID}_ztagA

$ROSETTA3BIN/bin/rna_denovo.default.linuxgccrelease -s ./<dir>/*pdb -nstruct 100 -fasta ./<fastafile>.fasta -secstruct_file ./<dot-brackets>.secstruct

wait
done

我尝试将for循环参数放在各个行之前/之后,包括waitand done,但我收到一条错误消息,说它无法打开 fasta、secstruct 和或 ./dir。我也尝试过先创建 10 个数组(这很容易),然后执行以下操作:

#!/bin/bash
for i in {1..10}
do
    sbatch ./array_{i}/<filename>.slurm
wait
done

但这不会将输出文件或子目录放入数组文件夹中;它要么将它们留在父级中。

有什么建议么?

4

1 回答 1

0

经过几天的断断续续的尝试,我想通了。我编写了一个在每个目录中执行 SLURM 的 shell 脚本,而不是尝试编辑 SLURM 脚本本身。

#!/bin/bash

for i in {1..10}
do
    cd array_${i}
    sbatch ./<name_of_slurm_script>.slurm
    cd ../
wait
done
于 2020-06-05T19:40:04.383 回答