5

我正在尝试使用 BeautifulSoup 解码实体,但没有运气。

from BeautifulSoup import BeautifulSoup

decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES)

print decoded

输出根本不解码。我在这里找到了很多使用这种方法的答案。我做错了什么吗?

我想为此使用 BeautifulSoup,所以请不要告诉我标准库有解码实体的方法。

4

1 回答 1

2

你需要print decoded.contents

>>> print decoded
<p> </p>
>>> print decoded.contents
[u'<p> </p>']
于 2012-04-10T12:01:53.723 回答