3

我正在尝试使用snakemake制作一个简单的管道,从网上下载两个文件,然后将它们合并到一个输出中。

我认为可行的是以下代码:

dwn_lnks = {
    '1': 'https://molb7621.github.io/workshop/_downloads/sample.fa',
    '2': 'https://molb7621.github.io/workshop/_downloads/sample.fa'       
    }
import os

# association between chromosomes and their links
def chromo2link(wildcards):
    return dwn_lnks[wildcards.chromo]

rule all:
    input:
        os.path.join('genome_dir', 'human_en37_sm.fa')

rule download:
    output:
        expand(os.path.join('chr_dir', '{chromo}')),
    params:
        link=chromo2link,
    shell:
        "wget {params.link} -O {output}"


rule merger:
    input:
        expand(os.path.join('chr_dir', "{chromo}"), chromo=dwn_lnks.keys())
    output:
        os.path.join('genome_dir', 'human_en37_sm.fa')
    run:
        txt = open({output}, 'a+')
        with open (os.path.join('chr_dir', "{chromo}") as file:
                    line = file.readline()
                    while line:
                        txt.write(line)
                        line = file.readline()
        txt.close()

此代码返回错误: No values given for wildcard 'chromo'. in line 20

另外,在合并规则中,运行中的python代码不起作用。

snakemake 包中的教程没有涵盖足够的示例来了解非计算机科学家的详细信息。如果有人知道一个很好的资源来学习如何使用snakemake,如果他们能分享我将不胜感激:)。

4

1 回答 1

4

问题是expand规则的输出中有一个函数download没有定义通配符的值{chromo}。我想你真正想要的是

rule download:
output:
    'chr_dir/{chromo}',
params:
    link=chromo2link,
shell:
    "wget {params.link} -o {output}"

没有expand. 该expand函数只需要对通配符进行聚合,就像您在 rule 中所做的那样merger

还可以查看官方的 Snakemake 教程,其中详细解释了这一点。

于 2017-06-23T12:58:46.383 回答