我已经建立了一个刮板,并想在 scrapy 中使用代理下载一些图像。不知道是不是真的是通过代理下载的。响应标头不显示 IP。此外,如果我将 IP 更改为随机 IP,它仍然会下载图像。如何确保它使用代理来下载图像?谢谢
管道.py
import scrapy
from scrapy.pipelines.images import ImagesPipeline
from scrapy.exceptions import DropItem
class MyImagesPipeline(ImagesPipeline):
def get_media_requests(self, item, info):
meta = {'proxy': 'http://23.323.44.22:11111/'}
for image_url in item['image_urls']:
yield scrapy.Request(image_url,meta=meta)
设置.py
ITEM_PIPELINES = {'myproject.pipelines.MyImagesPipeline': 1}