我正在尝试从文本文件中提取 DNA 序列并将其存储。我可以使用下面的代码来做到这一点,但这不是最好的方法,因为我正在逐行读取文本文件。我想知道是否有一种更简单的方法可以在我的文本文件中找到每个 DNA 序列,而无需逐行读取文本文件。
例子.pl
#!/usr/local/bin/perl
open(MYFILE, 'data.txt');
@entire_file = <MYFILE>;
while (<MYFILE>) {
chomp;
print "$_\n";
}
$line1 = <MYFILE>;
chomp $line1;
$line2 = <MYFILE>;
chomp $line2;
$line3 = <MYFILE>;
chomp $line3;
$line4 = <MYFILE>;
chomp $line4;
$line5 = <MYFILE>;
chomp $line5;
#Prints DNA sequence 1
print "$line2";
#Prints DNA sequence 2
print "$line5";
close(MYFILE);
数据.txt
gi|171361, 酿酒酵母, (CYS3) 基因, 实验室 1, Joe Bloggs GCAGCGATCGACAGCTGTGCTATCCCGGCGAGCCCGTGGCAGAGGACCTCGCTTGCGAAAGCATCGAGTACC
gi|171362, 酿酒酵母, (CYS4) 基因, 实验室 2, Paul McDonald GAAGCGCACGACAGCTGTGCTATCCCGGCGAGCCCGTGGCAGAGGACCTCGCTTGCGAAAGCATCGAGTACC