我正在尝试使用以下代码从数据库中提取序列:
use strict;
use Bio::SearchIO;
use Bio::DB::Fasta;
my ($file, $id, $start, $end) = ("secondround_merged_expanded.fasta","C7136661:0-107",1,10);
my $db = Bio::DB::Fasta->new($file);
my $seq = $db->seq($id, $start, $end);
print $seq,"\n";
我试图提取的序列的标题是:C7136661:0-107
,如文件中所示:
>C7047455:0-100
TATAATGCGAATATCGACATTCATTTGAACTGTTAAATCGGTAACATAAGCAGCACACCTGGGCAGATAGTAAAGGCATATGATAATAAGCTGGGGGCTA
当我将标题切换到更标准的东西(如test
)时,代码工作正常。我认为 BioPerl 不喜欢非标准标题。有什么办法可以解决这个问题,这样我就不必重新编码 FASTA 文件了?