编辑:由于规范中的澄清和更改,我编辑了我的代码,仍然使用显式Node
类作为中间步骤以清晰起见——逻辑是将行列表转换为节点列表,然后转换该列表将节点放入树中(通过适当地使用它们的 indent 属性),然后以可读的形式打印该树(这只是一个“调试帮助”步骤,以检查树是否构造良好,当然可以在脚本的最终版本——当然,它会从文件中获取行而不是硬编码以进行调试!-),最后构建所需的 Python 结构并打印它。这是代码,正如我们之后将看到的,结果几乎与 OP 指定的一样,但有一个例外——但是,首先是代码:
import sys
class Node(object):
def __init__(self, title, indent):
self.title = title
self.indent = indent
self.children = []
self.notes = []
self.parent = None
def __repr__(self):
return 'Node(%s, %s, %r, %s)' % (
self.indent, self.parent, self.title, self.notes)
def aspython(self):
result = dict(title=self.title, children=topython(self.children))
if self.notes:
result['notes'] = self.notes
return result
def print_tree(node):
print ' ' * node.indent, node.title
for subnode in node.children:
print_tree(subnode)
for note in node.notes:
print ' ' * node.indent, 'Note:', note
def topython(nodelist):
return [node.aspython() for node in nodelist]
def lines_to_tree(lines):
nodes = []
for line in lines:
indent = len(line) - len(line.lstrip())
marker, body = line.strip().split(None, 1)
if marker == '*':
nodes.append(Node(body, indent))
elif marker == '-':
nodes[-1].notes.append(body)
else:
print>>sys.stderr, "Invalid marker %r" % marker
tree = Node('', -1)
curr = tree
for node in nodes:
while node.indent <= curr.indent:
curr = curr.parent
node.parent = curr
curr.children.append(node)
curr = node
return tree
data = """\
* 1
* 1.1
* 1.2
- Note for 1.2
* 2
* 3
- Note for root
""".splitlines()
def main():
tree = lines_to_tree(data)
print_tree(tree)
print
alist = topython(tree.children)
print alist
if __name__ == '__main__':
main()
运行时,它会发出:
1
1.1
1.2
Note: 1.2
2
3
Note: 3
[{'children': [{'children': [], 'title': '1.1'}, {'notes': ['Note for 1.2'], 'children': [], 'title': '1.2'}], 'title': '1'}, {'children': [], 'title': '2'}, {'notes': ['Note for root'], 'children': [], 'title': '3'}]
除了键的顺序(这在 dict 中是无关紧要的,当然也不能保证),这几乎符合要求——除了这里所有的注释都显示为 dict 条目,键为notes
,值是字符串列表(但如果列表为空,则注释条目将被省略,大致如问题示例中所做的那样)。
在当前版本的问题中,如何表示笔记有点不清楚;一个音符显示为独立字符串,其他音符显示为值为字符串的条目(而不是我使用的字符串列表)。目前尚不清楚在一种情况下注释必须作为独立字符串出现,在所有其他情况下作为字典条目出现是什么意思,所以我使用的这个方案更常规;如果一个注释(如果有的话)是一个字符串而不是一个列表,这是否意味着如果一个节点出现多个注释是错误的?在后一方面,我使用的这个方案更通用(让一个节点从 0 开始有任意数量的音符,而不是问题中明显暗示的只有 0 或 1)。
编写了这么多代码(预编辑答案大约一样长,并有助于澄清和更改规范)以提供(我希望)99% 的所需解决方案,我希望这能满足原始海报,因为最后几次调整使它们相互匹配的代码和/或规范对他来说应该很容易做到!