1

我有一个基因组数据库,其中包含一个简单的字符序列(如>chr1 AGTGTCA.....)。现在,我想将其转换为标准的FASTQ 格式,如下所示:

@HWUSI-EAS594-R:1:3:1453:1350#0/1 
CCCAGTTCCGACGATCGATTTGCACGTCAGAATCGCTACGGACCTCCATCAGGGTTTCCCCTGACTTCGTCCTGACCAGG
+   
ea^cdfdffgggggggggggeggggdggdffgdbdgddgggg`g^dfbfgdggcfbgfffcb]gffbfcfcefbbBBBB

由于我对这种格式不清楚,我无法转换它。如何将简单的字符序列转换为 FASTQ 格式(如上例所示)?

具体来说,我要问:

  1. 是否有任何现有的代码来进行编码?
  2. 如果不是,我如何在 FASTQ 中编码字符序列?这种格式意味着什么,我该如何创建它?
4

1 回答 1

4

因为您只有序列而不是序列推导的质量(可靠性)分数,所以我认为您没有足够的信息来构建 FASTQ 文件。(不过,我不是生物信息学专家。)相反,您应该继续使用FASTA 文件格式,它只包含序列信息。

于 2011-07-10T02:20:54.993 回答