我有一个约 300 GB 的压缩 vcf 文件 (.vcf.gz),其中包含大约 700 只狗的基因组。我只对其中的几只狗感兴趣,目前我没有足够的空间来解压缩整个文件,尽管我正在准备一台计算机来执行此操作。是否可以仅解压缩文件的一部分以开始测试我的脚本?
我正在尝试在样本子集的某个位置找到特定的 SNP。我尝试使用bcftools无济于事:(如果有人能找出问题所在,我也会非常感激。我为输出创建了一个空文件(722g.990.SNP.INDEL.chrAll.vcf.bgz)但是它返回以下错误)
bcftools view -f PASS --threads 8 -r chr9:55252802-55252810 -o 722g.990.SNP.INDEL.chrAll.vcf.gz -O z 722g.990.SNP.INDEL.chrAll.vcf.bgz
无法识别输出类型“722g.990.SNP.INDEL.chrAll.vcf.bgz”
我打算尝试awk,但需要先解压缩文件。是否可以部分解压缩它以便我可以试试这个?