Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在做一个使用 python 和 mechanize 制作基于网络的代理的项目。我有一个问题:机械化返回的页面具有未机械化的 URL,如果用户单击它,他们将通过自己计算机的 ip(而不是我的代码安装在其上的服务器)访问链接。有什么办法可以解决吗?
您可以通过使用 lxml、漂亮的汤等解析 HTML 来重写 url,然后重写它们并将 DOM 重新转储为字符串,然后再将其发送给用户。或者通过使用正则表达式搜索 URL,并返回一个重写的 HTML。
请记住,使用 javascript 生成的链接等正确地进行操作几乎是不可能的。
这就是人们使用代理服务器的原因。