4
from bs4 import BeautifulSoup

xmlcontent = "some text with <tags>"

bs = BeautifulSoup(xmlcontent, "xml")

print bs

输出:

<?xml version="1.0" encoding="utf-8"?>
some text with <tags>

是否可以不输出:

<?xml version="1.0" encoding="utf-8"?>

我知道如果使用lxml, 来删除<body>我可以做的添加标签:

bs = BeautifulSoup(xmlcontent, "lxml")

print bs.body.next

是否有等价的使用 withxml以便不包括 xml 版本和编码?

我选择使用xmlover lxml,因为要解析的内容通常都是 xml 格式 - 这是最好的选择还是我可以只lxml用于 xml 内容?

4

1 回答 1

0

这似乎有效:

from bs4 import BeautifulSoup

xmlcontent = "some text with <tags>"

bs = BeautifulSoup(xmlcontent, "xml")

bs = bs.encode_contents()

print type(bs) # it's a string

print bs

# some text with <tags>
于 2013-10-07T06:07:23.287 回答