您提供的数据或多或少是一个s-expression。鉴于这是您要摄取的格式,pyparsing(一个 Python 模块)有一个s-expression parser。
您还需要一个图形库。我的大部分工作都使用networkx 。使用 pyparsing s-expression 解析器和 networkx,以下代码获取数据并创建树作为有向图:
import networkx as nx
def build(g, X):
if isinstance(X, list):
parent = X[0]
g.add_node(parent)
for branch in X[1:]:
child = build(g, branch)
g.add_edge(parent, child)
return parent
if isinstance(X, basestring):
g.add_node(X)
return X
#-- The sexp parser is constructed by the code example at...
#-- http://http://pyparsing.wikispaces.com/file/view/sexpParser.py
sexpr = sexp.parseString("(A (B1 C1 C2) B2)", parseAll = True)
#-- Get the parsing results as a list of component lists.
nested = sexpr.asList( )
#-- Construct an empty digraph.
dig = nx.DiGraph( )
#-- build the tree
for component in nested:
build(dig, component)
#-- Write out the tree as a graphml file.
nx.write_graphml(dig, 'tree.graphml', prettyprint = True)
为了测试这一点,我还将树编写为 .dot 文件并使用 graphviz 创建以下图像:
networkx 是一个很好的图形库,如果需要,您可以编写额外的代码遍历树以使用额外的元数据标记边缘或节点。