假设我有一个分配了 10 个 IP 的 squid 代理服务器(本地在我的 gigE 网络上)。
假设我有一个不同的服务器,分配了不同的 10 个 IP,运行 ac# 应用程序,该应用程序运行 10 个线程,每个线程用于抓取网站。每个线程使用不同的分配 IP 来发送其 HTTP 请求。
我的问题是,如果我在该应用程序中运行 10 个线程,其中每个线程使用来自代理服务器的代理 IP 来抓取网站。我还在该应用程序中尝试了 10 个线程,其中每个线程直接在服务器上使用本地分配的 IP 来抓取站点。从一个页面到另一个页面,使用代理 IP 的线程,或使用来自其自己服务器的直接 IP 的线程,哪个会更快地爬取站点?
我会想象服务器上的直接 IP,因为代理服务器具有固有的延迟,但它证明代理服务器稍微快一些。所以我很困惑。也许是因为使用直接 IP 会使用一些处理能力,并且通过使用代理服务器,它能够将该处理外包给代理服务器?非常感谢您的帮助。