1

我想获取所有具有特定类的元素的主体。

Python xml.dom.minidom 有一种通过 id 获取元素的方法,getElementById()但我需要获取所有具有特定类的元素。

我如何获得这个?

请注意,如果使用 minidom 无法做到这一点,请提供一个简单的替代方案,让我可以获取此类元素的全部内容。完整内容是指所有子节点和它们下面的文本,作为一个简单的字符串。

4

1 回答 1

1

我建议您使用lxml而不是 xml.dom.minidom。

使用 lxml.html/cssselect:

import lxml.html

root = lxml.html.fromstring(document_string)
for elem in root.cssselect('elem.class'):
    print(elem.tag)
    print(elem.get('src'))

使用 lxml.etree / xpath:

import lxml.etree

root = lxml.etree.fromstring(document_string)
for elem in root.xpath('.//elem[contains(@class, "class")]'):
    print(elem.tag)
    print(elem.get('src'))
于 2013-06-17T18:42:52.657 回答