我正在使用 CrawlSpider 类来抓取网站,并且我想修改在每个请求中发送的标头。具体来说,我想将引用者添加到请求中。
根据这个问题,我检查了
response.request.headers.get('Referer', None)
在我的响应解析函数中并且Referer
标题不存在。我认为这意味着没有在请求中提交推荐人(除非网站没有返回它,我不确定)。
我无法弄清楚如何修改请求的标头。同样,我的蜘蛛是从 CrawlSpider 派生的。覆盖 CrawlSpider_requests_to_follow
或为规则指定process_request
回调将不起作用,因为此时引用者不在范围内。
有谁知道如何动态修改请求标头?