3

我发现 lxml 的初始学习曲线有点陡峭 - 只是常见的任务,例如按名称、属性抓取节点并获取它们的内容。这是一个非常简单的问题。

我有一个 XML 文件。我想找到所有名为<Review>. 如何使用 lxml 最有效地做到这一点?

f = open('./test.xml')
xml = f.read()
tree = etree.parse(StringIO(xml))
context = etree.iterparse(StringIO(xml))
# How to get all the tags with the name <Review>
reviews = tree.findall('Review') # Something like this?

我不知道我是否应该使用objectify,xpath ...

关于我在文件中读取并将其转换为可解析的 lxml 对象的方式,也欢迎发表评论。谢谢。

4

1 回答 1

6

请参阅文档

tree = etree.parse(open('./test.xml'))
reviews = tree.findall(".//Review")
于 2012-05-22T11:32:30.297 回答