wildcard - 如何获取蛇形输出规则中通配符值的基本名称？

Question

在以下示例中，将在与输入文件相同的位置创建输出文件。有没有办法在输出部分获取通配符值的基本名称，以便我可以使用输入文件的基本名称来命名输出文件但将其写入不同的位置？

infile=['/home/user/folder1/file1','/home/user/folder2/file2/']

rule one:
 input: expand("{myfile}", myfile = infile)

 output: "{myfile}" + ".out"

 shell: "touch {wildcards.myfile}.out"

score 3 · Accepted Answer

在 Snakemake 中有一个简单的方法可以使用lambdaPython 的函数来做到这一点。

首先，您应该创建一个文件的字典，文件名作为键，文件的路径作为值，如下所示：

files = {'filesA' : 'path/to/fileA.ext', 'filesB' : 'path/to/fileB.ext'}

这个字典可以在蛇文件或配置文件中。我建议把它放在配置文件中并像这样调用它config['dict_name']

lambda所以现在让我们使用函数编写您的规则：

rule all : 
 input :
   #If you want to create in a different directory use this,
   #but it has to be like output from rule one. 
   #expand('{directory}{filename}{extension}',
           #directory = 'path/to/newdir',
           #filename = config['dictname'].keys(),
           #extension = '.out')
   #Otherwise
   expand('{filename}{extension}',
          filename = config['dictname'].keys(),
          extension = '.out')
rule one:
 input: lambda wildcards: config['dictname'][wildcards.input]

 output: "{input}" + ".out"

 message: "Executing one using {input}"

 shell: "touch {input}.out"

在代码中，您有两条规则，all将执行第一个调用的规则。因此，当您启动时，snakemake它会想要获取与expand函数创建的列表相对应的文件列表。

Snakemake 将查看规则是否生成该文件列表，如果不是，它将在目录中搜索它们。如您所见，您可以使用expand目录、文件名、后缀、前缀、扩展名...

在这个例子中，Snakemake 想要一些文件的文件名是键字典和扩展名.out。该规则one是生产它们的完美规则。

该规则的one工作方式如下：对于字典的每个键，将执行该规则。输入部分的 lambda 函数扮演了这个角色。为了记录，可以随意调用通配符input只是一个例子。

为了更优雅，您可以将 lambda 函数的内容放入一个变量中，如下所示：

_input_One = lambda wildcards: config['dictname'][wildcards.input]

然后像这样编写规则一输入：

input: _input_One

有关更多信息，请查看https://snakemake.readthedocs.io/en/stable/上的文档

雨果

wildcard - 如何获取蛇形输出规则中通配符值的基本名称？

1 回答 1

Related

Reference