1

现在这只是一个技术挑战,但基本上我想做以下事情:

创建一个基于 web 的反向(网关)代理mod_proxymod_proxy_html它不仅重写 HTML url 以匹配代理的主机名,而且重写或操作正在代理的 HTML。

这种对“中间人”网关代理的操作将允许人们做各种事情,例如:

  • 移除广告
  • 将文本从一种语言翻译成另一种语言
  • 以其他方式破解或“改进”原始网站

当然,它也可能被用于很多不好的事情,但这超出了这个问题的范围。

我知道它会mod_proxy_html解析原始 HTML 以重写所有 URL,但它是否也允许我编写自己的代码来评估和操作正在解析的 HTML?或者还有其他模块吗?

或者,是否有可用的反向代理可以做到这一点?我愿意适应任何适合此目的的语言。

4

1 回答 1

1

通过使用mod_rewriteormod_proxy_html你也许可以做到这一点。

这些模块允许您重写/美化 URL,正如您可能已经知道的那样。您可以更改它们的结构,以便接收到的网页中的链接如下所示,而不是更改网页的内容,这不是 Apache 的角色:

10.10.1.1/my_secret_injector/alter?url=<the_real_url>

而不仅仅是<the_real_url>.

然后在指定的网络服务器(10.10.1.1)上以您选择的语言实施您的广告移除算法或任何其他语言。

于 2013-04-06T11:06:36.333 回答