我正在尝试创建一个表格刮板,我已经编写了这段代码http://pastebin.com/t1wSPvbb 但是我在以文本形式保存数据时遇到问题,在 10 页后刮板保存相同的数据
这是代码问题:
for num in range(1,500):
print num
try:
resp = ''
resp = opener.open("http://login.site.com/view.asp?view&PAGE="+str(num))
soup = BeautifulSoup(resp.read())
for tr in soup.find_all('tr')[3:]:
tds = tr.find_all('td')
outfile.write (tds[2].text.encode('utf-8','replace') + ',' + tds[0].text.encode('utf-8','replace') + ',' + tds[1].text.encode('utf-8','replace') + '\n')
pass
except:
pass
10 页后,刮板会为接下来的几页保存相同的数据。