0

我正在做一个使用 python 和 mechanize 制作基于网络的代理的项目。我有一个问题:机械化返回的页面具有未机械化的 URL,如果用户单击它,他们将通过自己计算机的 ip(而不是我的代码安装在其上的服务器)访问链接。有什么办法可以解决吗?

4

1 回答 1

0

您可以通过使用 lxml、漂亮的汤等解析 HTML 来重写 url,然后重写它们并将 DOM 重新转储为字符串,然后再将其发送给用户。或者通过使用正则表达式搜索 URL,并返回一个重写的 HTML。

请记住,使用 javascript 生成的链接等正确地进行操作几乎是不可能的。

这就是人们使用代理服务器的原因。

于 2012-06-03T09:45:58.443 回答