问题标签 [nextflow]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nextflow - 通过 CLI 提供 NextFlow 工作流输入(不是参数)
我有以下(简化的)nextflow 模块。它有一个进程,在 fasta 文件上运行多序列比对,以及运行此进程的工作流(最终它也会运行其他进程):
我希望这个工作流程既可以作为子工作流程导入,也可以直接执行。出于这个原因,我没有指定任何参数,而只使用了输入(因为我相信在调用子工作流时无法指定参数)。
但是,我看不到直接在命令行上运行此子工作流的方法。
如果我运行,nextflow run msa.nf -entry msa
我会收到以下错误:
这是有道理的——我没有指定这些文件的来源。但我怎么能?如果我遵循文档的配置部分并nextflow.config
使用以下内容创建一个:
我仍然收到此错误。我也知道有一个-params-file
选项,但我相信它只适用于参数,而不是输入。
nextflow - Nextflow实现使用两个通道中对应的两个输入
我正在实现一个 nextflow 管道,我想使用两个输入,每个输入包含我将在此过程中使用的文件
python - 在 nextflow 中使用 bash 修改 Python 脚本输出
我有一个 python 脚本(make_chunk.py),它从输入通道获取输入文件并打印 3 个数组。
我想从上面的输出中创建 3 个不同的 bash 数组。在终端是可行的。我想在 nextflow 脚本中使用相同的命令来创建稍后将使用的那些数组。到目前为止,我已经尝试过:
对于上面的 nextflow 过程,我收到以下错误:
但是在 bash 终端中,这些命令可以正常工作。对这件事有什么帮助吗?
nextflow - splitCsv 为每一行多次加入通道 nextflow
我有一个my_csv.csv
包含三列的 csv 文件,我可以使用它来读取它spliCsv
,如下所示:
我有另一个map_ch
看起来像的频道
……
现在,我想得到:
如果我使用join
运算符,我只会得到
这不是我需要的
nextflow - 缺少 nextflow 进程预期的输出文件
我有一个 nextflow 过程,它输入多个文件做一些事情,然后输出一些文件。在此过程中,我删除了条件中的空文件。
该过程工作正常。该impute4
程序提供*gen.gz
文件的输出,其中一些可能是空的。因此,添加了 if 语句以删除那些空文件,因为qctools
无法读取空文件并且进程崩溃。问题是,现在我收到错误:
我该如何解决这个问题。有什么帮助吗?
nextflow - 输出文件(染色体块)在 nextflow 中合并
我有一个 nextflow 过程,它为每个染色体生成多个块到一个通道中,比如说,imputation
它看起来像,
每条染色体有很多块(22 条染色体)。对于要获取的每种类型的文件集,我如何有效地将它们合并到各自的染色体中,
获得合并输出后,我想删除所有块。有什么帮助吗?
生成这些块的实际代码是:
nextflow - 如何在 nextflow 中合并多个分组的输出文件
我有一个将多个文件作为元组输出的过程。像这样:
我怎么能得到chr1.merged.bgen
和chr1.merged.stat
。我想用来cat
合并所有这些块。
我试过了:
但是得到了 "Input tuple does not match input set cardinality decalred
也用于:
同样的错误。我也尝试使用my_output.collect()
和my_output.toList()
但得到同样的错误。有什么帮助吗?
nextflow - 如何分层收集渠道?
如何为两个列表中的每对值运行一个实例,然后一次只收集其中一个列表的输出?
例如,如果您运行此 Nextflow 脚本:
你得到两个输出文件(如预期的那样):1.out
和2.out
. 每一个都包含相同的行集:
我怎样才能使它1.out
只包含1 A
and 1 B
,并且2.out
只包含2 A
and 2 B
?即,通道仅根据输入收集输出并保持具有不同输入的单独.collect()
实例?foo
p1
letter
number
nextflow - RNA-seq 示例工作流程中的 nextflow .collect() 方法
我知道collect()
当我们运行一个将两个通道作为输入的过程时,我们必须使用,其中第一个通道有一个元素,然后第二个通道有 > 1 个元素:
现在的问题是:为什么 nextflow-io ( https://github.com/nextflow-io/rnaseq-nf/blob/master/modules/rnaseq.nf#L15 ) 的示例工作流中的这一行可以在不使用collect()
or的情况下工作toList()
?
同样的情况,一个元素(索引)的通道和一个大于 1 的通道(fastq 对)应该被同一个进程(quant)使用,并且它在所有 fastq 文件上运行。与我的虚拟示例相比,我缺少什么?
nextflow - 从下一个流中提取样本 ID fromPath()
我是 nextflow 的新手,这是我想测试一个真正的工作的实践。
这个脚本的输出是:
这里002-002
,015-002
等004-005
是样本 ID。我正在尝试编写一个简单的过程来输出诸如 ${sample.id}_sorted_dedup.calls.cns 之类的文件,但我不确定如何提取这些 id 并将其输出。
如何修改process cnvcalls
以使其与 sample.id 一起使用?