我正在编写一个自动爬取网站以进行数据分析的 Ruby 脚本,现在我有一个相当复杂的要求:我必须能够模拟来自不同国家的访问,大约 20 个不同的国家。该网站将根据 IP 位置包含不同的信息,因此完成它的唯一方法是从实际位于该国家/地区的服务器请求它。
由于我不想在这 20 个国家/地区中的每一个都购买服务器,因此我选择尝试 Tor - 你们中的许多人都知道,通过编辑 torrc 配置文件,可以指定退出节点,从而指定国家/地区实际请求将来自哪个。
当我手动执行此操作时,例如通过编辑 torrc 文件以使用阿根廷服务器,然后使用 Vidalia 断开 Tor,重新连接 Vidalia,然后重新运行请求,它工作正常。但是,我想完全自动化这个过程,并尽可能高效地完成它。Tor 是用 C 语言编写的,我想避免为此拆开它的整个源代码。知道仅使用 Ruby 来自动化整个过程的最简单方法是什么吗?
另外,如果我遗漏了一些东西,并且有一个更简单的替代方案可以替代整个考验,请告诉我。
谢谢!