我尝试解析 html 页面并获取货币值并写入 csv。我有以下代码:
#!/usr/bin/env python
import urllib2
from BeautifulSoup import BeautifulSoup
contenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily"
soup = BeautifulSoup(urllib2.urlopen(contenturl).read())
table = soup.find('div', attrs={'class': 'content'})
rows = table.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
text = td.find(text=True) + ';'
print text,
print
问题是,我不知道如何仅检索货币值。我尝试了一些正则表达式,例如 '^[0-9]{3}' - 从 3 位数字开始,但它不起作用。