2

我正在从文件中读取一个字符串:

a = '<script>closedSign: \'<img src="/static/images/drop-down.png" style="margin-top: -3px;"  />\'</script>'

现在,当我跑步时

BeautifulSoup(a)

<script>closedSign: '&lt;img src="/static/images/drop-down.png" style="margin-top: -3px;"   /&gt;'</script>

因此,<img被 HTML 转义到&lt;img

我怎样才能避免这种情况?

4

2 回答 2

4

使用 BeautifulSoup 3.2.0 而不是 3.2.1 来解决这个问题。

于 2012-11-18T11:55:03.167 回答
2

查看Beautiful Soup 文档的“实体转换”部分。

soup = BeautifulSoup(html, convertEntities=BeautifulSoup.HTML_ENTITIES)
于 2012-11-08T15:35:49.663 回答