问题标签 [bcftools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
64 浏览

vcf-variant-call-format - VCF 文件的 ALT 列包含替代核苷酸 AND <*>

为什么我的 VCF 文件的 ALT 列有时包含替代核苷酸以及“符号等位基因”<*>?这是什么意思?ALT 的图像此外,在 INFO 字段中,AD 标签告诉我零读数具有符号等位基因(即 AD=37,1,0)

0 投票
1 回答
45 浏览

compiler-errors - bcftools make 在 win10 中失败并出现大量 vcfmerge 错误

我想编译最新的 github bcftools 但我在下面得到这些错误。

[安装说明] https://raw.githubusercontent.com/samtools/bcftools/develop/INSTALL提到:

另外,我做了以下事情:

  1. BCFTOOLS_PLUGINS=/path/to/bcftools/plugins(添加到 Makefile)和这些 3rd 方库(下载并添加到路径)
  2. zlib、gsl 和 libperl

make 命令运行时的错误

0 投票
1 回答
1281 浏览

bioinformatics - 将多个 VCF 文件合并为一个大 VCF 文件

我有来自特定种族的 VCF 文件列表,例如美洲印第安人、中国人、欧洲人等

在每个种族下,我有大约 100 多个文件。

目前,我计算了 一个文件的VARIANT QC 指标,例如 call_raten_het 等,如冰雹教程中所示(参考下图)

图片在这里

但是,现在我想为每个种族创建一个文件,然后计算VARIANT_QC指标。

我已经提到了这篇文章 和这篇文章,但不认为这能解决我的问题

如何在特定种族下的所有文件中执行此操作?

可以帮我解决这个问题吗?

有没有hail/python/R/other tools办法做到这一点?

0 投票
1 回答
51 浏览

linux - 如何知道一个unix命令执行是否成功

我最近bcftools在命令行中尝试了一个命令(处理变体文件)。

我尝试过的命令如下

但是,该命令正在运行,但需要很长时间才能合并。所以,我让系统通宵运行。

但是,当我醒来时,我看到系统因电量耗尽而关闭

如何知道我在 Unix/Linux 终端中的最后一个命令是否成功?

上面显示的命令只是一个示例。您甚至可以向我解释如何使用simple gzip operation.

虽然我确实看到了,但final.vcf.gz我不能说命令是成功的,因为一旦命令开始运行,我就会看到这个文件正在生成。所以,我不能依赖

请问有什么帮助吗?

0 投票
1 回答
42 浏览

revit-api - 我无法使 Revit 中这些对象的 ElementID 与 Revit 文件中的元素匹配的原因是什么?

我正在创建一个插件,该插件利用BCFier提供的代码从文件的外部服务器版本中选择元素并在 Revit 视图中突出显示它们,除非在 Revit 中明显找不到元素,因为所有元素都出现并且没有突出显示. 我正在使用的具体代码是:

Which is the section that should filter the lists, which it does do as it produces IDs that look like this: 3GB5RcUGnAzQe9amE4i4IN 3GB5RcUGnAzQe9amE4i4Ib 3GB5RcUGnAzQe9amE4i4J6 3GB5RcUGnAzQe9amE4i4JH 3GB5RcUGnAzQe9amE4i4Ji 3GB5RcUGnAzQe9amE4i4J$ 3GB5RcUGnAzQe9amE4i4GD 3GB5RcUGnAzQe9amE4i4Gy 3GB5RcUGnAzQe9amE4i4HM 3GB5RcUGnAzQe9amE4i4HX 3GB5RcUGnAzQe9amE4i4Hf 068MKId$X7hf9uMEB2S_no

这样做的问题是,将它与我们从中导入它的 IFC 文件中的 ID 列表进行比较,发现这些 ID 没有出现在 IFC 文件中,并且在 Revit 中查看它我发现 Revit 中没有任何 Guid '不在出现的列表中。几乎所有对象也与 ID 的相同主要部分匹配,我没有足够的经验知道这有多大可能。

所以我的问题是,这段代码中有什么问题吗?

0 投票
1 回答
799 浏览

sorting - 由于输入无效,无法使用 bcftools 对 VCF 进行排序

我正在尝试压缩和索引 VCF 文件并面临几个问题。

  1. 当我使用 bgzip/tabix 时,它会抛出一个错误,指出由于某些未排序的值而无法对其进行索引。
  1. 当我使用bcftools sort对此 VCF 进行排序以解决 #1 时,由于条目无效,它会引发错误。
  1. 我尝试使用 linux 命令进行排序以绕过#2。但是,当我运行下面的代码时, 的大小fout.vcf几乎是 的一半fin.vcf,这表明可能出了问题。

如果您对以下方面有任何建议,请告诉我:

  • 如何以安全可行的方式对 VCF 中有问题的输入进行排序/修复。(文件是340G,所以我不能简单地打开文件并编辑。)
  • 为什么我的 linuxsort可能会以一种奇怪的方式表现。(即返回的文件比原始文件小得多。)

任何意见或建议表示赞赏!

0 投票
2 回答
97 浏览

bash - 使用 gzip 和 bcftools 的 Bash 脚本因大文件而内存不足

此 bash 脚本旨在成为处理压缩 .vcf 文件的管道的一部分,该文件包含来自多个患者的基因组(这意味着即使压缩文件也很大,例如 3-5GB)。

我的问题是我在运行这个脚本时总是内存不足。它在 GCP 高内存 VM 中运行。

我希望有一种方法可以优化内存使用,这样就不会失败。我调查了一下,但什么也没找到。

0 投票
1 回答
247 浏览

zip - bcftools 视图的输出格式

我正在使用 Bcftools 从 GVCF 文件中提取单个样本 VCF。

不幸的是,输出的格式似乎不是 Bgzip 压缩的,尽管使用了 -Oz 标志。

有人知道为什么会这样吗?

0 投票
0 回答
309 浏览

bash - 如何使用 bcftools 视图根据深度过滤我的 vcf 文件?

我以前使用 GATK 和 vcftools 来调用我的 scRNA-seq 数据中的变体。现在我正在尝试使用 bcftools (v.1.9) 来查看是否得到相同的变体。

到目前为止,我已经完成了以下工作:

这创建了一个我用 htsfile 检查的 bcf 文件,它看起来很好。然后我运行 bcftools 调用:

这给了我一个vcf文件。再次使用 htsfile 检查它给了我我所期望的。简要检查它具有所有预期列的文件:(以下是一个示例行)#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT 20190219_Gli1_5d_A03 1 6226714。TT 37.4152。INDEL;IDV=2;IMF=1;DP=2;VDB=0.1;SGB=-0.453602;MQ0F=0;AC=2;AN=2;DP4=0,0,2,0;MQ=60 GT: PL 1/1:67,6,0

现在我想根据读取深度进行过滤。我只想要 DP=10 或更多的职位。我已经尝试过 vcftools (v0.1.16),但它给了我一个空文件,即使我知道有 DP>10 的位置。这是我运行的 vcftools 代码:

然后我用这段代码尝试了 bcftools 视图:

但是,这给了我错误:

我已经尝试了几个小时,但在任何论坛中都找不到任何答案。非常感谢一些指导!

提前感谢科拉

0 投票
0 回答
77 浏览

consensus - 为什么 vcf2fq 生成的共识序列即使在它们占主导地位时也会错过插入缺失?怎么修?

在对齐序列读数并转换为 BAM 后,我可以看到 9 个碱基缺失的存在。

这个删除区域也被 mpileup 和 bcftools 正确调用

平板电脑中 BAM 文件区域的可视化。 星号是删除。

在共有序列中,这部分是:

在 vcf 文件中,我确实看到这些 indel 突变具有比其他更多数量的删除突变读取。

总共 224 个读数中的 167+29 = 196 个显示删除。除了两端有一个碱基外,其他缺失重叠,占主导地位的比例相似。

有没有一种方法可以使删除的部分被删除(或用---------填充)而不是少数读取中的核苷酸产生共识?