我想知道 Snakemake 中是否有一种方法可以定义一个实际上不是输入文件的依赖项。我的意思是,有些程序期望某些文件存在,而命令行上没有提供。
让我们bwa
作为一个例子来考虑。这是来自Johannes Köster 映射规则的规则:
rule bwa_mem_map:
input:
lambda wildcards: config["references"][wildcards.reference],
lambda wildcards: config["units"][wildcards.unit]
output:
"mapping/{reference}/units/{unit}.bam"
params:
sample=lambda wildcards: UNIT_TO_SAMPLE[wildcards.unit],
custom=config.get("params_bwa_mem", "")
log:
"mapping/log/{reference}/{unit}.log"
threads: 8
shell:
"bwa mem {params.custom} "
r"-R '@RG\tID:{wildcards.unit}\t"
"SM:{params.sample}\tPL:{config[platform]}' "
"-t {threads} {input} 2> {log} "
"| samtools view -Sbh - > {output}"
在这里,bwa 期望基因组索引文件存在,而它不是命令行参数(索引文件的路径是从基因组路径推导出来的)。
有没有办法告诉 Snakemake 索引文件是一个依赖项,如果 Snakemake 知道如何生成这个文件,他会查看它的规则吗?
我想您仍然可以将规则输入重写为:
rule bwa_mem_map:
input:
genome=lambda wildcards: config["references"][wildcards.reference],
fastq=lambda wildcards: config["units"][wildcards.unit]
index=foo.idx
并相应地调整规则run
部分。这是最好的解决方案吗?
提前致谢。拜诺伊斯特