我正在制作一个网络爬虫,我想完全删除一些 div,因为我对数据的分析不需要它们。我正在使用 Beautiful Soup 来解析数据,但我不知道如何完全消除 div
问问题
340 次
1 回答
1
您可以使用以下内容:
>>> import bs4
>>> blah = '<div id="test"><p>one</p></div><div id="okay"><p>something</p></div>'
>>> soup = bs4.BeautifulSoup(blah)
>>> soup('div', {'id': 'test'})[0].extract()
<div id="test"><p>one</p></div>
>>> soup
<html><body><div id="okay"><p>something</p></div></body></html>
于 2012-11-30T20:20:35.153 回答