0

我有 DNA 序列数据。例如,

X="ACGGGT"
Y="ACGGT"

我想知道对齐分数,因此我使用了 biopython pairwise2 函数。例如,

from Bio import pairwise2
from Bio.pairwise2 import format_alignment

alignments = pairwise2.align.globalxx(X, Y)
for a in alignments:
    print(format_alignment(*a))

这成功地显示了 DNA 比对,但我只需要如下分数。有没有办法只显示分数?

在此处输入图像描述

我使用了 biopython,但如果有更好的方法,将不胜感激。

4

1 回答 1

5

取每个对齐元组的第 3 项(或为获得最佳分数,仅解析score_only参数):

>>> from Bio import pairwise2
>>> X="ACGGGT"
>>> Y="ACGGT"
>>> alignments = pairwise2.align.globalxx(X, Y)
>>> [a[2] for a in alignments]
[5.0, 5.0, 5.0]
>>> pairwise2.align.globalxx(X, Y, score_only=True)
5.0

另请参阅较新的Bio.Align模块,该模块对于许多用例可能具有更高的性能。如果您只想要最好的分数,您可以使用aligner.score()Markus评论

>>> from Bio import Align
>>> aligner = Align.PairwiseAligner()
>>> alignments = aligner.align(X,Y)
>>> [a.score for a in alignments]
[5.0, 5.0, 5.0]
>>> aligner.score(X, Y)
5.0

如果您想要分数,那么避免生成完整对齐是两个模块最快和最节省内存的方法。

于 2019-03-24T21:11:31.487 回答