我正在尝试在scraperwiki上使用 Mechanize/Python ( http :// /scraperwiki.com/scrapers/food_standards_agency/)但在尝试遵循具有以下形式的“下一页”链接时遇到问题:
<input type="submit" name="ctl00$ContentPlaceHolder1$uxResults$uxNext" value="Next >" id="ctl00_ContentPlaceHolder1_uxResults_uxNext" title="Next >" />
表单处理程序如下所示:
<form method="post" action="QuickSearch.aspx?q=po30" onsubmit="javascript:return WebForm_OnSubmit();" onkeypress="javascript:return WebForm_FireDefaultButton(event, 'ctl00_ContentPlaceHolder1_buttonSearch')" id="aspnetForm">
<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" />
<input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" />
<input type="hidden" name="__LASTFOCUS" id="__LASTFOCUS" value="" />
当我手动单击 Next 链接时,HTTP 跟踪显示 __EVENTTARGET 为空?我可以在其他刮刀上找到的所有婴儿床都显示了对 __EVENTTARGET 的操作作为处理下一页的方式。
确实,我不确定我要抓取的页面如何加载下一页?无论我向刮板扔什么,它都只能加载第一个结果页面。(即使能够更改每页的结果数量也会很有用,但我也不知道该怎么做!)
那么 - 关于如何为 N>0 抓取第 1+N 个结果页面的任何想法?