感谢您花时间看这个。
我有一个 fastq 文件,我想把它翻译成互补,而不是反向互补,像这样:
@Some header example:1:
ACTGAGACTCGATCA
+
S0m3_Qu4l1t13s&
翻译成
@Some header example:1:
TGACTCTGAGCTAGT
+
S0m3_Qu4l1t13s&
我使用的代码是:
awk '{
if(NR==100000){break}
else if((NR+2) % 4 ==0 ){ system("echo " $0 "| tr ATGC TACG") }
else print $0}' MyFastqFyle.fastq > MyDesiredFile.fastq
它有效!但是这种方法很慢,即使是小文件(250M)。我想知道哪种其他方式可以更快地完成这项工作,不管这是在 R 还是 bash 或类似的。
(我查看了 BioStrings 但我只发现了反向互补功能,并且标题中的“@”而不是“>”存在一些问题)