我有一个基因组数据库,其中包含一个简单的字符序列(如>chr1 AGTGTCA.....
)。现在,我想将其转换为标准的FASTQ 格式,如下所示:
@HWUSI-EAS594-R:1:3:1453:1350#0/1
CCCAGTTCCGACGATCGATTTGCACGTCAGAATCGCTACGGACCTCCATCAGGGTTTCCCCTGACTTCGTCCTGACCAGG
+
ea^cdfdffgggggggggggeggggdggdffgdbdgddgggg`g^dfbfgdggcfbgfffcb]gffbfcfcefbbBBBB
由于我对这种格式不清楚,我无法转换它。如何将简单的字符序列转换为 FASTQ 格式(如上例所示)?
具体来说,我要问:
- 是否有任何现有的代码来进行编码?
- 如果不是,我如何在 FASTQ 中编码字符序列?这种格式意味着什么,我该如何创建它?