我有一组 fasta 格式的对齐序列。我想从对齐中获得共识。在大多数站点的情况下,基地之一显示出最大的出现率。在两个或多个碱基出现相同次数的位点的情况下,应取哪个碱基。下面给出一个例子:
>Seq_1
ATGCGA
>Seq_2
AT-CGT
>Seq_3
AT-CCG
>Seq_4
AT-CCC
>Seq_5
AA-CT-
根据惯例,这将是共识
Site : 1 2 3 4 5 6
Consensus : A T G C [G/C] N
但是当与其他序列对齐时,共有序列的这个输出会抛出错误。那么在这种情况下应该怎么做以及如何为这些网站达成共识呢?