1

还有其他包,尤其是 R 的ape,它们构建了一个无根树,然后允许您通过显式指定一个 outgroup来对其进行根。

相比之下,在 BioPython 中,我可以直接创建一个有根树而不指定根,所以我想知道根是如何确定的,例如从以下代码。

from Bio import AlignIO
alignment = AlignIO.read('mulscle-msa-aligned-105628a58654.fasta', 'fasta')
from Bio.Phylo.TreeConstruction import DistanceCalculator
calculator = DistanceCalculator('ident')
dm = calculator.get_distance(alignment)
from Bio.Phylo.TreeConstruction import DistanceTreeConstructor
constructor = DistanceTreeConstructor()
tree = constructor.upgma(dm)
from Bio import Phylo
Phylo.write(tree, 'phyloxml-7016bed7d42.xml', 'phyloxml')

我在构建树之后在这里制作了序列,但尽管如此,这是一个从该过程构建的有根树。

在此处输入图像描述

4

1 回答 1

1

正如@cel 所说,这是 UPGMA 算法的产物。UPGMA 通过从现在(或无论何时您的数据来自)向后工作来创建一棵树。它首先找到两个最相似的物种。理论上,这些物种的共同祖先比任何其他物种都更近,因此它们被归为一组。它们的共同祖先与树中其他物种的相似性是通过平均每个物种与该组所有成员的相似性来粗略估计的。

这个过程继续进行,在每一步将树中最相似的两个物种(或假定的共同祖先)分组,然后重新计算相似度,直到只剩下两组。其中一个群体可能只有一个成员,在这种情况下,它可以有效地被认为是外群体,但它们也可能都有很多成员。树的根是这两组的共同祖先。

于 2015-05-15T04:13:14.903 回答