0

我正在尝试创建一个表格刮板,我已经编写了这段代码http://pastebin.com/t1wSPvbb 但是我在以文本形式保存数据时遇到问题,在 10 页后刮板保存相同的数据

这是代码问题:

for num in range(1,500):
    print num
    try:
        resp = ''
        resp = opener.open("http://login.site.com/view.asp?view&PAGE="+str(num))
        soup = BeautifulSoup(resp.read())
        for tr in soup.find_all('tr')[3:]:
                tds = tr.find_all('td')
                outfile.write (tds[2].text.encode('utf-8','replace') + ',' +  tds[0].text.encode('utf-8','replace') + ',' + tds[1].text.encode('utf-8','replace') + '\n')
                
                pass
    except:
        pass

10 页后,刮板会为接下来的几页保存相同的数据。

4

0 回答 0