我正在为学术研究编写网络爬虫。这个爬虫发出数百万个请求,我想分发超过十个左右的 IP 地址。
我的机器已经有一个 IP 地址。我可以通过使用 Tor 获得一秒钟。我可以从 Tor 获得更多的 IP 地址吗?这是我这样做的想法(以及围绕它们的问题)
- 运行多个 Tor 实例;每个都提供一个 IP 地址。(但是 Tor 会映射超过一两个匿名 IP 地址到我的机器上吗?)
- 运行一个实例,但为每个请求更改其身份。(但 Tor 会限制这种行为,如此处所述?)
这些想法中的任何一个都行得通,还是括号中的部分会使它们失败?还有其他想法吗?