from bs4 import BeautifulSoup
xmlcontent = "some text with <tags>"
bs = BeautifulSoup(xmlcontent, "xml")
print bs
输出:
<?xml version="1.0" encoding="utf-8"?>
some text with <tags>
是否可以不输出:
<?xml version="1.0" encoding="utf-8"?>
我知道如果使用lxml
, 来删除<body>
我可以做的添加标签:
bs = BeautifulSoup(xmlcontent, "lxml")
print bs.body.next
是否有等价的使用 withxml
以便不包括 xml 版本和编码?
我选择使用xml
over lxml
,因为要解析的内容通常都是 xml 格式 - 这是最好的选择还是我可以只lxml
用于 xml 内容?