0

我正在尝试将此脚本(vcf-consensus)与一个简单的示例一起使用,但我有一个错误:在 fasta 文件中找不到序列“7”。

语法是:

Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa

我的 FASTA 文件是:

TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACTTT

我的 VCF 文件是:

##fileformat=VCFv4.1
#CHROM  POS ID  REF ALT QUAL    FILTER  INFO    FORMAT  SAMPLE
7   1   .   T   A   .   .   .   GT  0/1
7   2   .   G   A   .   .   .   GT  0/1
7   3   .   G   A   .   .   .   GT  0/1
7   4   .   C   A   .   .   .   GT  0/1

我通过 bgzip 压缩并通过 tabix 索引 VCF 文件:

bgzip vcfFile.vcf
tabix -p vcfFile.vcf.gz

然后,我执行:

cat fastaFile.fa | vcf-consensus vcfFile.vcf.gz > out.fa

我收到此错误:在 fasta 文件中找不到序列“7”。

有人知道吗?

谢谢。

4

1 回答 1

1

您的 VCF 仅包含第 1 列中的染色体“7”。

但你的 fasta 标题是

>gi|157696558|ref|NW_001838997.1| Homo sapiens chromosome 7 genomic scaffold, alternate assembly HuRef SCAF_1103279187418, whole genome shotgun sequence

如果您的 fasta 标头只是: tabix 将起作用:

>7
于 2014-11-23T10:50:46.393 回答