我正在为一个研究项目提取数据,我已经成功地findAll('div', attrs={'class':'someClassName'})
在许多网站中使用过,但这个特定的网站,
当我使用 attrs 选项时不返回任何值。但是当我不使用 attrs 选项时,我会得到整个 html dom。
这是我开始测试它的简单代码:
soup = bs(urlopen(url))
for div in soup.findAll('div', attrs={'class':'data'}):
print div