我对 Biopython 的 pairwise2 函数有点熟悉,但我注意到它在序列中添加了破折号以获得最佳的对齐分数。例如,
for a in pairwise2.align.globalxx("ACCGT", "ACG"):
print(format_alignment(*a))
会产生这个结果:
ACCGT
|||||
A-CG-
Score=3
<BLANKLINE>
ACCGT
|||||
AC-G-
Score=3
<BLANKLINE>
即使第二个序列中的前 2 个字符(A 和 C)与第一个序列对齐。有没有办法找到对齐碱基对的数量而不是对齐碱基对的最高数量(例如:ACTGAA 序列相对于 GCCGTA 序列的得分为 3)?