2

这是来自 WordPress 帖子详细信息页面的汤:

content = soup.body.find('div', id=re.compile('post'))
title = content.h2.extract()
item['title'] = unicode(title.string)
item['content'] = u''.join(map(unicode, content.contents))

我想div在分配时省略封闭标签item['content']。有没有办法以 unicode 呈现标签的所有子标签?就像是:

item['content'] = content.contents.__unicode__()

这会给我一个 unicode 字符串而不是一个列表。

4

1 回答 1

6

你有没有尝试过:

unicode(content)

它将content's 标记转换为单个 Unicode 字符串。

编辑:如果您不想要封闭标签,请尝试:

content.renderContents()
于 2009-05-09T12:44:51.060 回答