我正在尝试使用 bcftools 合并 3000 个细菌 bcf 文件。vcf 文件已使用 GATK 生成并转换为 bcf 并由 bcftools 索引。bcftools 继续分析 20% 的数据,但它一直过早终止并仅为部分变体生成合并的 bcf 文件(来自 2M 细菌基因组的高达 500kb)。我正在使用的代码是这样的:
bcftools1.7/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF
输出错误是:
/bin/sh: line 1: 17041 Segmentation fault (core dumped) bcftools/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF
以前我对 400 个样本尝试了相同的命令,没有任何问题。
在线搜索,“当对变量的引用落在该变量所在的段之外,或者尝试写入只读段中的位置时,就会发生段错误”。该命令在为特定作业提供 80Gb 可用 RAM 的集群上运行。我不确定这个错误是由于 bcftools 软件本身的问题还是由于运行该命令的系统的限制?
这是用于复制错误的示例 bcf 文件 ( https://figshare.com/articles/BCF_file_segfault/7412864 )。该错误仅出现在大样本量中,因此我无法进一步减小样本量。