我有一个 FASTQ 质量分数,它显示为一系列 ASCII 字符。在这种情况下(可能)ASCII 字符 64 到 126 代表 0 到 62 的分数(假设它是 Illumina)。这产生了基础序列:
feffefdfbefdfffcfdeTddaYddffbfcI``S_KKX_]]MR[D_TY[VTVXQ]`Q_BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
如何提取 ASCII 字符的数量?
谢谢你桑
编辑:这个序列表示由碱基组成的生物序列的质量(来自核酸中的碱基对,意味着一个字符(ATGC))。碱基质量是 phred 标度的碱基错误概率,等于 -10 log10 Pr{碱基错误}。