我要解析的 XML 如下所示:
<root>
<group>
<somethingelse>
<group></group>
</somethingelse>
</group>
</root>
如您所见,<group>
在 another 的层次结构中有 a <group>
。将其解析为BeautifulStoneSoup
将内部置于<group>
外部(参见下面的示例)。
如何防止这种情况并将内部保持在<group>
定义的位置?
代码
from BeautifulSoup import BeautifulStoneSoup
xml = """
<root>
<group>
<somethingelse>
<group></group>
</somethingelse>
</group>
</root>
"""
def main():
doc = BeautifulStoneSoup(xml)
print doc.prettify()
if __name__ == '__main__':
main()
结果
<root>
<group>
<somethingelse>
</somethingelse>
</group>
<group>
</group>
</root>