3

我尝试使用 BeautifulSoup 使用以下代码更改一些 html 文档的标题标签:

>>> doc = BeautifulSoup(open(filename))
>>> root = doc.find('html') # works only with html parser
>>> hafta = root.find(id="hafta")
>>> content = hafta.find('div', {'class':'convHtml'})
>>> content.find('b').string
u'BAKANLARA N\u0130\xc7\u0130N KURBAN KES\u0130L\u0130R?'
>>> doc.title.string = content.find('b').string
>>> content.find('b').string
>>>  

奇怪的是,该语句doc.title.string = content.find('b').string清除了content.find('b'). 为什么会出现这种情况?

4

1 回答 1

3

这是Beautiful Soup 中的错误。我已经提交了一个修复,它将在下一个版本中发布。

于 2012-04-16T13:11:30.280 回答