3

我正在尝试创建一个透明的HTTP 代理。它的目的是停留在浏览器和 Web 服务器之间并且不可见。这是我正在使用的代码。不幸的是,它运行得不是很好。$base_uri当我打开网页(由 我正在一个网站上尝试它,它返回包括“ transfer-encoding: chunked”在内的各种响应(所以我想问题可能就在那里?!)。我认为cookies也可能存在问题,但我不知道如何解决它们(如果有的话......)。

#!/usr/bin/perl

use strict;

use HTTP::Daemon;
use LWP::UserAgent;
use HTTP::Cookies;

my $cookie_jar = HTTP::Cookies->new();

my $ua = LWP::UserAgent->new( max_redirect => 0, env_proxy => 0,keep_alive => 1, timeout => 30, agent => "Mozilla/4.76 [en] (Win98; U)");
my $d = HTTP::Daemon->new( 
    LocalHost => "localhost",  # remove this to listen from other machines 
                   # (i.e. open-relay... be careful of spammers!)
    LocalPort => 33331
) || die;
print "[Proxy URL:", $d->url, "]\n";

fork(); fork(); fork();  # 2^3 = 8 processes

$ua->cookie_jar($cookie_jar);

my $base_uri = 'http://example.com/';

while (my $c = $d->accept) {
        while (my $request = $c->get_request) {
            my $uri = $base_uri . $request->uri->as_string();
            my $method = $request->method;
            my $req = HTTP::Request->new($method, $uri);

            $request->uri($uri);

            print "[[ $method >> $uri ]]\n";
            my $response = $ua->simple_request($request);
            $c->send_response( $response );
        }
    $c->close;
    undef($c);
}

先感谢您!

4

1 回答 1

0

不清楚,你真正想要什么。你应该更好地描述它。如果您描述需要该代理的内容和原因以及它需要哪些功能,那么任何帮助都会好得多。不过我会试试的。

您当前所做的是获取传入连接,提取 URI 和调用方法并将其传递给您的源。嗯,HTTP 要复杂得多——你去掉所有的东西,比如传输的数据(例如对于 POST 请求)以及所有的标题行(cookies、登录数据、浏览器标识、语言规范……),它们通常携带重要信息. 你也修改了很多时间行为。然后你把它发送到你的代理目标。

现在您获取服务器答案并再次剥离所有相关内容。您也只能在完成后回复答案。对于流数据,这将不起作用(您已经提到了分块传输模式)。此外,您的方法需要大量内存来存储大文件(例如 DVD 映像 - 4GB)。

如果没有有关您的应用程序的更多详细信息,则无法提供真正的建议,但有一些想法:

a) 正如评论中所说,有可用的 Perl 模块。您可以测试它们,看看它们是否符合您的需求。

b) 你可以降一级。使用IO::Socket::INETorINET6和 直接在套接字级别上工作。将每个数据包直接发送到输出。这几乎是 100% 透明的(除了 IP 地址和可能的 TCP 数据包大小)。想想如果你想更改或检查数据,你直接需要自己处理 HTTP,这在当今非常复杂(尤其是由于传输编码)。

c) 也许不要自己编写代码,而是使用现有的代理(例如 Apache 网络服务器或特定的代理程序)。

于 2013-01-04T21:25:13.020 回答