0

我真的试图解决这个问题,但似乎以前没有其他人遇到过这个问题。我从 1000G 解压了 fastq 文件:

gunzip -c **hs37d5.fa.gz** | awk '{if(NR%4==1) {printf(">%s\n",substr($0,2));} else if(NR%4==2) print;}' > ref.fa

但是,解压缩的文件夹有一些“尾随垃圾”,它会导致以下错误:

“线程“主”picard.PicardException 中的异常:序列名称在参考中出现多次:NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN”

尝试运行时:

java -jar picard.jar CreateSequenceDictionary R=ref.fasta O=ref.dict

如果有人可以给我一点帮助,将不胜感激。

4

0 回答 0