我正在努力获取我想要的数据,如果你知道如何使用 BS,我相信它非常简单。阅读文档后,我一直在努力解决这个问题几个小时而无济于事。
目前我的代码在python中输出:
[<td>0.32%</td>, <td><span class="neg color ">>-0.01</span></td>, <td>0.29%</td>, <td>0.38%</td>, <td><span class="neu">0.00</span></td>]
我将如何隔离不包含标签的 td 标签的内容?
即我只希望看到 0.32%、0.29%、0.38%。
谢谢你。
import urllib2
from bs4 import BeautifulSoup
fturl = 'http://markets.ft.com/research/Markets/Bonds'
ftcontent = urllib2.urlopen(fturl).read()
soup = BeautifulSoup(ftcontent)
ftdata = soup.find(name="div", attrs={'class':'wsodModuleContent'}).find_all(name="td", attrs={'class':''})