0

我正在用 BeautifulSoup 编写一个 HTML 文档,我希望它不要将内联文本(例如<p>标签内的文本)拆分为多行。我得到的问题是<p>a<span>b</span>c</p>用 prettify 解析给了我输出

<p>
  a
<span>
b
</span>
c
</p>

现在 HTML 显示 a、b、c 之间的空格,这是我不想要的。我该如何避免这种情况?

4

2 回答 2

2

完全不用怎么prettify办?

BeautifulSoup.BeautifulSoup('<p>a<span>b</span>c</p>').renderContents()

输出没有多余空格的原始 HTML。您可以稍后使用例如 Firebug 来仔细查看文档的结构,而无需在构建时对其进行“美化”。

于 2010-01-22T23:16:15.023 回答
0

我只是这样做:

from BeautifulSoup import BeautifulSoup

ht = '<p>a<span>b</span>c</p>'
soup = BeautifulSoup(ht)
print soup

并避免获得任何额外的空白。 prettify的工作就是调整空白以清楚地显示 HTML 解析树的结构,毕竟......!

于 2010-01-23T03:17:18.343 回答