我已成功使用此链接使用 Tor 运行 Scrapy:http: //pkmishra.github.io/blog/2013/03/18/how-to-run-scrapy-with-TOR-and-multiple-browser-agents-第 1 部分-mac/
但我无法使用 Tor 运行 Splash。
在 Scrapy-settings.py 中,我针对 http_proxy(8123 是 polipo 端口)指向 polipo:
HTTP_PROXY = 'http://127.0.0.1:8123'
在 polipo.config 中,我指向 tor(9150 是 tor 端口):
socksParentProxy = localhost:9150
diskCacheRoot=""
非常适合scrapy。在飞溅中它不起作用。但我不得不说 splash 或 docker 来使用 polipo 为 http_proxy 就像在 scrapy-settings.py 中一样。Docker 应该以某种方式使用 polipo,而 polipo 将直接指向 tor。我怎样才能做到这一点?
我跑飞溅:
sudo docker run -p 5023:5023 -p 8050:8050 -p 80511 scrapinghub/splash
在 etc/default/docker 中,我尝试使用 docker 直接指向 polipo:
export http_proxy='http://127.0.0.1:8123'
Environment="http_proxy=http://127.0.0.1:8123"
但我无法成功。我究竟做错了什么?谢谢 :)