我有一个结构数据数组,类似于:
- name: foobar
sex: male
fastqs:
- r1: /path/to/foobar_R1.fastq.gz
r2: /path/to/foobar_R2.fastq.gz
- r1: /path/to/more/foobar_R1.fastq.gz
r2: /path/to/more/foobar_R2.fastq.gz
- name: bazquux
sex: female
fastqs:
- r1: /path/to/bazquux_R1.fastq.gz
r2: /path/to/bazquux_R2.fastq.gz
请注意,fastqs 是成对出现的,每个“样本”的对数可能是可变的。
我想process
在 nextflow 中编写一个一次处理一个样本的方法。
为了让 nextflow 执行器正确地编组文件,它们必须以某种方式键入path
(或file
)。这样键入后,执行程序会将文件复制到计算节点进行处理。只需键入文件路径,var
将路径视为字符串,不会复制任何文件。
来自文档path
的输入的一个简单示例:
process foo {
input:
path x from '/some/data/file.txt'
"""
your_command --in $x
"""
}
我应该如何声明process
输入以便将文件正确编组到计算节点?到目前为止,我还没有在文档中找到任何关于如何处理结构化输入的示例。