基因组的四链体序列如下所示:
Gx Ny1 Gx Ny2 Gx Ny3 Gx
其中 G 是鸟嘌呤碱基,Ns 代表其他碱基。x、y1、y2 和 y3 是整数。
如果 ,则特定段将是四重序列x >= 2
。
我的问题是我想计算一个 FASTA 序列中有多少这样的片段,以及它们的类型是什么,就 x、y1、y2 和 y3 而言。为此,我需要您的帮助。
基因组的四链体序列如下所示:
Gx Ny1 Gx Ny2 Gx Ny3 Gx
其中 G 是鸟嘌呤碱基,Ns 代表其他碱基。x、y1、y2 和 y3 是整数。
如果 ,则特定段将是四重序列x >= 2
。
我的问题是我想计算一个 FASTA 序列中有多少这样的片段,以及它们的类型是什么,就 x、y1、y2 和 y3 而言。为此,我需要您的帮助。