问题标签 [gatk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
variant - 如何在 conda 中运行 ensembl-vep
我是这样安装的:
然后像这样安装人类缓存:
但我无法使用任何命令运行它,例如
这给出了有关下载缓存的错误消息:
或者这个:
这给出了错误:
我想没有人能指出我正确的方向吗?
variant - bcftools 合并的 vcf 文件将所有变体分配给一个样本
我为三个样本中的每一个都制作了一个 vcf 文件。然后我使用 bcftools 将它们组合起来,如下所示:
然后合并列表:
并将其编入索引:
生成的合并 vcf 似乎有三列,每个样本一列。当我在 IGV 中打开它时,所有变体都分配给样本 3a7a(见图)
但是当我在 GenomeBrowse 中打开它时,我看到它们正确分配给了三个样本中的每一个:
我想不通是怎么回事?我在这里上传了单个和合并的 vcf 文件。非常感谢任何帮助
python - Snakemake vcf 文件的第一个基因型作为输出中的通配符
在第二条规则中,我想从包含 bob、clara 和 tim 的 vcf 文件中选择,只有在 roder 中的字典的第一个基因型(即 bob)作为第二条规则的输出bob.dn.vcf
。这可能snakemake
吗?
python - Snakemake 将多个命令行集成在一个规则中
我的第一个命令行的"bcftools query -l {input.invcf} | head -n 1"
输出打印了 vcf 文件的第一个个体的名称(即IND1
)。我想selectvariants GATK
在-sn IND1
选项中使用该输出。如何将第一条命令行集成到snakemake 中以便在下一条中使用它的输出?
java - GATK:HaplotypceCaller IntelPairHmm 仅检测 1 个线程
我似乎无法让 GATK 识别可用线程的数量。我在 conda 环境中运行 GATK (4.2.4.1),它是我正在编写的 nextflow (v20.10.0) 管道的一部分。无论出于何种原因,我都无法让 GATK 看到有多个线程。我尝试了不同的节点类型,增加和减少可用的 cpu 数量,提供 java 参数,例如-XX:ActiveProcessorCount=16
, using taskset
,但它总是只检测到 1。
这是来自的命令.command.sh
:
这是.command.log
文件的顶部:
我在广泛的研究所网站上发现了一个帖子,暗示它可能是 OMP 库,但这似乎已加载,我正在使用他们建议更新到的版本...
不用说,这有点慢。我总是可以使用该-L
选项进行并行化,但这并不能解决管道中的每一步都会非常慢的问题。
提前致谢。