问题标签 [gatk]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
17 浏览

variant - 使用等位基因特定注释运行 gatk HaplotypeCaller 时出错

我已经让 HaplotypeCaller 在标准模式下运行良好,如下所示:

但是当我在等位基因特定模式下尝试时,我收到以下错误。我所做的只是在最后添加 -G 注释,如此处所建议

这是错误:

0 投票
1 回答
25 浏览

variant - 如何在 conda 中运行 ensembl-vep

我是这样安装的:

然后像这样安装人类缓存:

但我无法使用任何命令运行它,例如

这给出了有关下载缓存的错误消息:

或者这个:

这给出了错误:

我想没有人能指出我正确的方向吗?

0 投票
0 回答
36 浏览

variant - bcftools 合并的 vcf 文件将所有变体分配给一个样本

我为三个样本中的每一个都制作了一个 vcf 文件。然后我使用 bcftools 将它们组合起来,如下所示:

然后合并列表:

并将其编入索引:

生成的合并 vcf 似乎有三列,每个样本一列。当我在 IGV 中打开它时,所有变体都分配给样本 3a7a(见图)

在此处输入图像描述

但是当我在 GenomeBrowse 中打开它时,我看到它们正确分配给了三个样本中的每一个:

在此处输入图像描述

我想不通是怎么回事?我在这里上传了单个和合并的 vcf 文件。非常感谢任何帮助

https://1drv.ms/u/s!AvBi5ipmBYfrhr8MPIDUjjYIcMI-rw?e=f8imqR

0 投票
1 回答
30 浏览

python - Snakemake vcf 文件的第一个基因型作为输出中的通配符

在第二条规则中,我想从包含 bob、clara 和 tim 的 vcf 文件中选择,只有在 roder 中的字典的第一个基因型(即 bob)作为第二条规则的输出bob.dn.vcf。这可能snakemake吗?

0 投票
3 回答
32 浏览

python - Snakemake 将多个命令行集成在一个规则中

我的第一个命令行的"bcftools query -l {input.invcf} | head -n 1"输出打印了 vcf 文件的第一个个体的名称(即IND1)。我想selectvariants GATK-sn IND1选项中使用该输出。如何将第一条命令行集成到snakemake 中以便在下一条中使用它的输出?

0 投票
1 回答
24 浏览

java - GATK:HaplotypceCaller IntelPairHmm 仅检测 1 个线程

我似乎无法让 GATK 识别可用线程的数量。我在 conda 环境中运行 GATK (4.2.4.1),它是我正在编写的 nextflow (v20.10.0) 管道的一部分。无论出于何种原因,我都无法让 GATK 看到有多个线程。我尝试了不同的节点类型,增加和减少可用的 cpu 数量,提供 java 参数,例如-XX:ActiveProcessorCount=16, using taskset,但它总是只检测到 1。

这是来自的命令.command.sh

这是.command.log文件的顶部:

我在广泛的研究所网站上发现了一个帖子,暗示它可能是 OMP 库,但这似乎已加载,我正在使用他们建议更新到的版本...

不用说,这有点慢。我总是可以使用该-L选项进行并行化,但这并不能解决管道中的每一步都会非常慢的问题。

提前致谢。