0

我有一棵大树,我想为每个叶节点获取到根的路径(所有节点)。

我正在尝试使用 ete2 执行此操作,但树太大而且似乎太慢了。

任何人都可以建议一种更快的方法吗?

这就是我正在做的事情:

    tr = Tree("anytree.nw", format=8)
    path_leaf_root = {} ## all paths from leafs to root
    root = tr.get_tree_root()
    for le in tr:
        if not path_leaf_root.has_key(le.name):
            path_leaf_root[le.name]=[]
        le_up = le
        while not le_up.name == root.name:
            le_up=le.up
            path_leaf_root[le.name].append(le_up.name)
4

1 回答 1

1

您可以尝试以下方法,该方法仅遍历树一次。在我的计算机中,它在 0.24 秒内处理了一个 50k 提示树(如果您打印或写入结果会更长一些):

from ete2 import Tree
t = Tree()
t.populate(50000)

import time
t1 = time.time()
current_path = [t]
for postorder, node in t.iter_prepostorder():
    if postorder:
        current_path.pop(-1)
    else:
        if not node.children:
            # print node.name, "path :", current_path
            pass
        else:
            current_path.append(node)
print time.time() - t1

# 0.242053985596
于 2014-10-24T06:09:30.357 回答