我想同时从多个目录中执行一个 SLURM脚本。更具体地说,我有十个编号的数组文件夹array_1
,array_10
我想从中执行脚本。在每个目录中,脚本创建 10 个子目录,标记为${SLURM_ARRAY_TASK_ID}_ztag
。但是,我必须从十个 array_ 目录中的每个目录中手动执行 SLURM 脚本。当我必须一遍又一遍地这样做时,这变得很麻烦。
通常,使用 shell 脚本,这将是一个简单的for
循环,但因为#SBATCH
不是由 bash 解释,所以我没有任何成功。当前脚本(在每个数组文件夹中单独运行)是:
#!/bin/bash
#SBATCH -o <some_thing>.o%j
#SBATCH --time=<time> #specify the time
#SBATCH --array=1-10 #ten arrays
#SBATCH -c 1
#SBATCH -C dodeca96gb
#SBATCH --mem=<memory>
echo "SLURM_JOBID: " $SLURM_JOBID
echo "SLURM_ARRAY_TASK_ID: " $SLURM_ARRAY_TASK_ID
echo "SLURM_ARRAY_JOB_ID: " $SLURM_ARRAY_JOB_ID
mkdir ${SLURM_ARRAY_TASK_ID}_ztagA #creates 10 subdirs w/i ea. array
cd ${SLURM_ARRAY_TASK_ID}_ztagA
$ROSETTA3BIN/bin/rna_denovo.default.linuxgccrelease -s ./<dir>/*pdb -nstruct 100 -fasta ./<fastafile>.fasta -secstruct_file ./<dot-brackets>.secstruct
然后我键入sbatch <filename>.slurm
,脚本从执行脚本的任何目录中创建子目录,因此需要该cd
行,因此要同时从所有十个数组中执行它是很棘手的。我尝试了以下各种组合:
#!/bin/bash
#SBATCH --array=1-10
#SBATCH --chdir=./array_%a
#SBATCH -o ./array_%a/<some_thing>.o%j #STDOUT
#SBATCH --time=<time>
#SBATCH -c 1
#SBATCH -C dodeca96gb
#SBATCH --mem=<memory>
echo "SLURM_JOBID: " $SLURM_JOBID
echo "SLURM_ARRAY_TASK_ID: " $SLURM_ARRAY_TASK_ID
echo "SLURM_ARRAY_JOB_ID: " $SLURM_ARRAY_JOB_ID
for i in {1..10}
do
mkdir -p ./array_${i}/${SLURM_ARRAY_TASK_ID}_ztagA
cd ./array_${i}/${SLURM_ARRAY_TASK_ID}_ztagA
$ROSETTA3BIN/bin/rna_denovo.default.linuxgccrelease -s ./<dir>/*pdb -nstruct 100 -fasta ./<fastafile>.fasta -secstruct_file ./<dot-brackets>.secstruct
wait
done
我尝试将for
循环参数放在各个行之前/之后,包括wait
and done
,但我收到一条错误消息,说它无法打开 fasta、secstruct 和或 ./dir。我也尝试过先创建 10 个数组(这很容易),然后执行以下操作:
#!/bin/bash
for i in {1..10}
do
sbatch ./array_{i}/<filename>.slurm
wait
done
但这不会将输出文件或子目录放入数组文件夹中;它要么将它们留在父级中。
有什么建议么?