问题标签 [bcftools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vcf-variant-call-format - VCF 文件的 ALT 列包含替代核苷酸 AND <*>
为什么我的 VCF 文件的 ALT 列有时包含替代核苷酸以及“符号等位基因”<*>?这是什么意思?ALT 的图像此外,在 INFO 字段中,AD 标签告诉我零读数具有符号等位基因(即 AD=37,1,0)
compiler-errors - bcftools make 在 win10 中失败并出现大量 vcfmerge 错误
我想编译最新的 github bcftools 但我在下面得到这些错误。
[安装说明] https://raw.githubusercontent.com/samtools/bcftools/develop/INSTALL提到:
另外,我做了以下事情:
- BCFTOOLS_PLUGINS=/path/to/bcftools/plugins(添加到 Makefile)和这些 3rd 方库(下载并添加到路径)
- zlib、gsl 和 libperl
make 命令运行时的错误
linux - 如何知道一个unix命令执行是否成功
我最近bcftools
在命令行中尝试了一个命令(处理变体文件)。
我尝试过的命令如下
但是,该命令正在运行,但需要很长时间才能合并。所以,我让系统通宵运行。
但是,当我醒来时,我看到系统因电量耗尽而关闭
如何知道我在 Unix/Linux 终端中的最后一个命令是否成功?
上面显示的命令只是一个示例。您甚至可以向我解释如何使用simple gzip operation
.
虽然我确实看到了,但final.vcf.gz
我不能说命令是成功的,因为一旦命令开始运行,我就会看到这个文件正在生成。所以,我不能依赖
请问有什么帮助吗?
revit-api - 我无法使 Revit 中这些对象的 ElementID 与 Revit 文件中的元素匹配的原因是什么?
我正在创建一个插件,该插件利用BCFier提供的代码从文件的外部服务器版本中选择元素并在 Revit 视图中突出显示它们,除非在 Revit 中明显找不到元素,因为所有元素都出现并且没有突出显示. 我正在使用的具体代码是:
Which is the section that should filter the lists, which it does do as it produces IDs that look like this: 3GB5RcUGnAzQe9amE4i4IN 3GB5RcUGnAzQe9amE4i4Ib 3GB5RcUGnAzQe9amE4i4J6 3GB5RcUGnAzQe9amE4i4JH 3GB5RcUGnAzQe9amE4i4Ji 3GB5RcUGnAzQe9amE4i4J$ 3GB5RcUGnAzQe9amE4i4GD 3GB5RcUGnAzQe9amE4i4Gy 3GB5RcUGnAzQe9amE4i4HM 3GB5RcUGnAzQe9amE4i4HX 3GB5RcUGnAzQe9amE4i4Hf 068MKId$X7hf9uMEB2S_no
这样做的问题是,将它与我们从中导入它的 IFC 文件中的 ID 列表进行比较,发现这些 ID 没有出现在 IFC 文件中,并且在 Revit 中查看它我发现 Revit 中没有任何 Guid '不在出现的列表中。几乎所有对象也与 ID 的相同主要部分匹配,我没有足够的经验知道这有多大可能。
所以我的问题是,这段代码中有什么问题吗?
sorting - 由于输入无效,无法使用 bcftools 对 VCF 进行排序
我正在尝试压缩和索引 VCF 文件并面临几个问题。
- 当我使用 bgzip/tabix 时,它会抛出一个错误,指出由于某些未排序的值而无法对其进行索引。
- 当我使用
bcftools sort
对此 VCF 进行排序以解决 #1 时,由于条目无效,它会引发错误。
- 我尝试使用 linux 命令进行排序以绕过#2。但是,当我运行下面的代码时, 的大小
fout.vcf
几乎是 的一半fin.vcf
,这表明可能出了问题。
如果您对以下方面有任何建议,请告诉我:
- 如何以安全可行的方式对 VCF 中有问题的输入进行排序/修复。(文件是340G,所以我不能简单地打开文件并编辑。)
- 为什么我的 linux
sort
可能会以一种奇怪的方式表现。(即返回的文件比原始文件小得多。)
任何意见或建议表示赞赏!
bash - 使用 gzip 和 bcftools 的 Bash 脚本因大文件而内存不足
此 bash 脚本旨在成为处理压缩 .vcf 文件的管道的一部分,该文件包含来自多个患者的基因组(这意味着即使压缩文件也很大,例如 3-5GB)。
我的问题是我在运行这个脚本时总是内存不足。它在 GCP 高内存 VM 中运行。
我希望有一种方法可以优化内存使用,这样就不会失败。我调查了一下,但什么也没找到。
zip - bcftools 视图的输出格式
我正在使用 Bcftools 从 GVCF 文件中提取单个样本 VCF。
不幸的是,输出的格式似乎不是 Bgzip 压缩的,尽管使用了 -Oz 标志。
有人知道为什么会这样吗?
bash - 如何使用 bcftools 视图根据深度过滤我的 vcf 文件?
我以前使用 GATK 和 vcftools 来调用我的 scRNA-seq 数据中的变体。现在我正在尝试使用 bcftools (v.1.9) 来查看是否得到相同的变体。
到目前为止,我已经完成了以下工作:
这创建了一个我用 htsfile 检查的 bcf 文件,它看起来很好。然后我运行 bcftools 调用:
这给了我一个vcf文件。再次使用 htsfile 检查它给了我我所期望的。简要检查它具有所有预期列的文件:(以下是一个示例行)#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT 20190219_Gli1_5d_A03 1 6226714。TT 37.4152。INDEL;IDV=2;IMF=1;DP=2;VDB=0.1;SGB=-0.453602;MQ0F=0;AC=2;AN=2;DP4=0,0,2,0;MQ=60 GT: PL 1/1:67,6,0
现在我想根据读取深度进行过滤。我只想要 DP=10 或更多的职位。我已经尝试过 vcftools (v0.1.16),但它给了我一个空文件,即使我知道有 DP>10 的位置。这是我运行的 vcftools 代码:
然后我用这段代码尝试了 bcftools 视图:
但是,这给了我错误:
我已经尝试了几个小时,但在任何论坛中都找不到任何答案。非常感谢一些指导!
提前感谢科拉