我是 Scrapy 的新手,通过一些教程,我能够抓取一些简单的网站,但我现在面临一个新网站的问题,我必须填写搜索表单并提取结果。我得到的响应没有结果。
例如,对于以下站点:http ://www.beaurepaires.com.au/store-locator/
我想提供一个邮政编码列表并在每个邮政编码中提取有关商店的信息(商店名称和地址)。
我正在使用以下代码,但它不工作,我不知道从哪里开始。
class BeaurepairesSpider(BaseSpider):
name = "beaurepaires"
allowed_domains = ["http://www.beaurepaires.com.au"]
start_urls = ["http://www.beaurepaires.com.au/store-locator/"]
#start_urls = ["http://www.beaurepaires.com.au/"]
def parse(self, response):
yield FormRequest.from_response(response, formname='frm_dealer_locator', formdata={'dealer_postcode_textfield':'2115'}, callback=self.parseBeaurepaires)
def parseBeaurepaires(self, response):
hxs = HtmlXPathSelector(response)
filename = "postcodetest3.txt"
open(filename, 'wb').write(response.body)
table = hxs.select("//div[@id='jl_results']/table/tbody")
headers = table.select("tr[position()<=1]")
data_rows = table.select("tr[position()>1]")
谢谢!!