我正在尝试运行一个带有集群提交的蛇形程序以进行 RNAseq 分析。这是我的脚本:
#path to gff
GFF = "RNASeq/data/ref_GRCh38.p2_top_level.gff3"
#sample names and classes
CTHP = 'CTHP1 CTHP2'.split()
CYP = 'CYP1 CYP2'.split()
samples = CTHP + CYP
rule all:
input:
'CTHP1/mapping_results/out_summary.gtf',
'CTHP2/mapping_results/out_summary.gtf',
'CYP2/mapping_results/out_summary.gtf',
'CYP1/mapping_results/out_summary.gtf',
rule order_sam:
input:
'{samples}/mapping_results/mapped.sam'
output:
'{samples}/mapping_results/ordered.mapped.bam'
threads: 12
params: ppn="nodes=1:ppn=12"
shell:
'samtools view -Su {input} | samtools sort > {output}'
rule count_sam:
input:
bam='{samples}/mapping_results/ordered.mapped.bam'
output:
summary='{samples}/mapping_results/out_summary.gtf',
abun='{samples}/mapping_results/abun_results.tab',
cover='{samples}/mapping_results/coveraged.gtf'
threads: 12
params: ppn="nodes=1:ppn=12"
shell:
'stringtie -o {output.summary} -G {GFF} -C {output.cover} '
'-A {output.abun} -p {threads} -l {samples} {input.bam}'
```
我想将每个提交rule
到一个集群。因此,在工作目录的终端中,我这样做:
snakemake --cluster "qsub -V -l {params.ppn}" -j 6
但是,作业未提交,并且出现以下错误:
Unable to run job: attribute "m_numa_nodes" is not a integer value.
Exiting.
Error submitting jobscript (exit code 1):
我还尝试在运行蛇文件时直接设置节点变量,如下所示:
snakemake --cluster "qsub -V -l nodes=1:ppn=16" -j 6
正如预期的那样,它给了我同样的错误。在这一点上,我不确定它是本地集群设置还是我在蛇文件中没有做的事情。任何帮助都会很棒。
谢谢