问题标签 [gatk]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

16 问题

0 投票

0 回答

17 浏览

variant - 使用等位基因特定注释运行 gatk HaplotypeCaller 时出错

我已经让 HaplotypeCaller 在标准模式下运行良好，如下所示：

但是当我在等位基因特定模式下尝试时，我收到以下错误。我所做的只是在最后添加 -G 注释，如此处所建议的。

这是错误：

variant gatk

2022-01-20T09:01:49.313

0 投票

1 回答

25 浏览

variant - 如何在 conda 中运行 ensembl-vep

我是这样安装的：

然后像这样安装人类缓存：

但我无法使用任何命令运行它，例如

这给出了有关下载缓存的错误消息：

或者这个：

这给出了错误：

我想没有人能指出我正确的方向吗？

2022-01-21T12:11:35.923

0 投票

0 回答

36 浏览

variant - bcftools 合并的 vcf 文件将所有变体分配给一个样本

我为三个样本中的每一个都制作了一个 vcf 文件。然后我使用 bcftools 将它们组合起来，如下所示：

然后合并列表：

并将其编入索引：

生成的合并 vcf 似乎有三列，每个样本一列。当我在 IGV 中打开它时，所有变体都分配给样本 3a7a（见图）

但是当我在 GenomeBrowse 中打开它时，我看到它们正确分配给了三个样本中的每一个：

我想不通是怎么回事？我在这里上传了单个和合并的 vcf 文件。非常感谢任何帮助

https://1drv.ms/u/s!AvBi5ipmBYfrhr8MPIDUjjYIcMI-rw?e=f8imqR

variant bcftools gatk

2022-01-24T21:28:03.973

0 投票

1 回答

30 浏览

python - Snakemake vcf 文件的第一个基因型作为输出中的通配符

在第二条规则中，我想从包含 bob、clara 和 tim 的 vcf 文件中选择，只有在 roder 中的字典的第一个基因型（即 bob）作为第二条规则的输出bob.dn.vcf。这可能snakemake吗？

python snakemake gatk

2022-02-03T11:46:47.890

0 投票

3 回答

32 浏览

python - Snakemake 将多个命令行集成在一个规则中

我的第一个命令行的"bcftools query -l {input.invcf} | head -n 1"输出打印了 vcf 文件的第一个个体的名称（即IND1）。我想selectvariants GATK在-sn IND1选项中使用该输出。如何将第一条命令行集成到snakemake 中以便在下一条中使用它的输出？

python bash shell snakemake gatk

2022-02-04T11:12:36.197

0 投票

1 回答

24 浏览

java - GATK：HaplotypceCaller IntelPairHmm 仅检测 1 个线程

我似乎无法让 GATK 识别可用线程的数量。我在 conda 环境中运行 GATK (4.2.4.1)，它是我正在编写的 nextflow (v20.10.0) 管道的一部分。无论出于何种原因，我都无法让 GATK 看到有多个线程。我尝试了不同的节点类型，增加和减少可用的 cpu 数量，提供 java 参数，例如-XX:ActiveProcessorCount=16, using taskset，但它总是只检测到 1。

这是来自的命令.command.sh：

这是.command.log文件的顶部：

我在广泛的研究所网站上发现了一个帖子，暗示它可能是 OMP 库，但这似乎已加载，我正在使用他们建议更新到的版本...

不用说，这有点慢。我总是可以使用该-L选项进行并行化，但这并不能解决管道中的每一步都会非常慢的问题。

提前致谢。

java multithreading gatk

2022-02-09T17:17:48.187

1 2 3 4 5 6 7 8 9 10

问题标签 [gatk]

variant - 使用等位基因特定注释运行 gatk HaplotypeCaller 时出错

variant - 如何在 conda 中运行 ensembl-vep

variant - bcftools 合并的 vcf 文件将所有变体分配给一个样本

python - Snakemake vcf 文件的第一个基因型作为输出中的通配符

python - Snakemake 将多个命令行集成在一个规则中

java - GATK：HaplotypceCaller IntelPairHmm 仅检测 1 个线程

Reference