应该如何在“输出”规则中使用配置数据?我发现输出字符串不能包含 {config.} 值。但是,可以使用 Python 代码包含它们,如下所示:
output: config["OutputDir"] + "/myfile.txt"
但是,这种方法不起作用(在输出:或输入:):
params: config=config
output: "{params.config[OutputDir]}/myfile.txt"
但是,它确实在“shell:”中工作:
params: config=config
output: config["OutputDir"] + "/myfile.txt"
shell: echo "OutputDir is {params.config[OutputDir]}" > {output}
请注意,shell cmd 中 [] 内的 OutputDir 周围没有引号。在字符串中扩展值的 {} 方法不使用键周围的引号。
可以按蛇文件方式或按python方式定义配置数据吗?是的!
参数可以在使用“configfile”包含的 .yaml 文件中定义,也可以通过使用“include”包含的常规 Python 文件定义。后者是恕我直言,因为 .yaml 文件不允许定义引用以前的定义,这在除了最简单的配置文件之外的所有文件中都很常见。
要使用 yaml 定义上面的“OutputDir”参数:
xxx.yaml:
OutputDir: DATA_DIR
蛇文件:
configfile: 'xxx.yaml'
要使用 Python 将其定义为与上述完全兼容:
xxx.py:
config['OutputDir'] = "DATA_DIR"
蛇文件:
include: 'xxx.py'
或者,在 Python 包含的配置文件中定义一个简单的变量“OutputDir”,然后在规则中使用它:
xxx.py:
OutputDir = "DATA_DIR"
蛇文件:
include: 'xxx.py'
rule:
output: OutputDir + "/myfile.txt"
可以通过 .yaml 文件和 python 文件轻松定义和访问多嵌套字典和列表。例子:
MACBOOK> cat cfgtest.yaml
cfgtestYAML:
A: 10
B: [1, 2, 99]
C:
nst1: "hello"
nst2: ["big", "world"]
MACBOOK> cat cfgtest.py
cfgtestPY = {
'X': -2,
'Y': range(4,7),
'Z': {
'nest1': "bye",
'nest2': ["A", "list"]
}
}
MACBOOK> cat cfgtest
configfile: "cfgtest.yaml"
include: "cfgtest.py"
rule:
output: 'cfgtest.txt'
params: YAML=config["cfgtestYAML"], PY=cfgtestPY
shell:
"""
echo "params.YAML[A]: {params.YAML[A]}" >{output}
echo "params.YAML[B]: {params.YAML[B]}" >>{output}
echo "params.YAML[B][2]: {params.YAML[B][2]}" >>{output}
echo "params.YAML[C]: {params.YAML[C]}" >>{output}
echo "params.YAML[C][nst1]: {params.YAML[C][nst1]}" >>{output}
echo "params.YAML[C][nst2]: {params.YAML[C][nst2]}" >>{output}
echo "params.YAML[C][nst2][1]: {params.YAML[C][nst2][1]}" >>{output}
echo "" >>{output}
echo "params.PY[X]: {params.PY[X]}" >>{output}
echo "params.PY[Y]: {params.PY[Y]}" >>{output}
echo "params.PY[Y][2]: {params.PY[Y][2]}" >>{output}
echo "params.PY[Z]: {params.PY[Z]}" >>{output}
echo "params.PY[Z][nest1]: {params.PY[Z][nest1]}" >>{output}
echo "params.PY[Z][nest2]: {params.PY[Z][nest2]}" >>{output}
echo "params.PY[Z][nest2][1]: {params.PY[Z][nest2][1]}" >>{output}
"""
MACBOOK> snakemake -s cfgtest
Provided cores: 1
Rules claiming more threads will be scaled down.
Job counts:
count jobs
1 1
1
rule 1:
output: cfgtest.txt
jobid: 0
Finished job 0.
1 of 1 steps (100%) done
MACBOOK> cat cfgtest.txt
params.YAML[A]: 10
params.YAML[B]: 1 2 99
params.YAML[B][2]: 99
params.YAML[C]: {'nst1': 'hello', 'nst2': ['big', 'world']}
params.YAML[C][nst1]: hello
params.YAML[C][nst2]: big world
params.YAML[C][nst2][1]: world
params.PY[X]: -2
params.PY[Y]: range(4, 7)
params.PY[Y][2]: 6
params.PY[Z]: {'nest1': 'bye', 'nest2': ['A', 'list']}
params.PY[Z][nest1]: bye
params.PY[Z][nest2]: A list
params.PY[Z][nest2][1]: list