0

我正在尝试用 c# 编写一个小型代理服务器。它适用于我测试过的许多网页(包括 google.com 和 microsoft.com)。为了进行测试,我启动了代理服务器并在 Windows 8 上配置了 IE 10 以使用它。

但是当我尝试 wikipedia.org 时,它只加载主页但没有图片。我试图加载一张图片(http://upload.wikimedia.org/wikipedia/commons/6/63/Wikipedia-logo.png)。当我在没有代理的情况下使用 IE 时,它可以工作,但使用代理我得到 404 响应。

这是 IE(我的代理只是转发它)发出的 GET 请求:

GET http://upload.wikimedia.org/wikipedia/commons/6/63/Wikipedia-logo.png HTTP/1.1
Accept: text/html, application/xhtml+xml, */*\
Accept-Language: de-CH\
User-Agent: Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0)
Accept-Encoding: gzip, deflate
Host: upload.wikimedia.org
DNT: 1
Proxy-Connection: Keep-Alive

恕我直言,它看起来是正确的。这是我得到的响应(省略了一些 html 标签):

HTTP/1.1 404 Not Found
Content-Type: text/html; charset=UTF-8
X-Varnish: 1427845074 1427806476, 274786836, 3671934588
Via: 1.1 varnish, 1.1 varnish, 1.1 varnish
Content-Length: 262
Accept-Ranges: bytes
Date: Mon, 01 Jul 2013 21:30:54 GMT
Age: 28
Connection: keep-alive
X-Cache: cp1063 hit (1), cp3004 miss (0), cp3003 frontend miss (0)
Access-Control-Allow-Origin: *

...404 Not Found\n  The resource could not be found.\nRegexp failed to match URI: "http:/upload.wikimedia.org/wikipedia/commons/6/63/Wikipedia-logo.png"

奇怪的部分在这里:

Regexp failed to match URI: "http:/upload.wikimedia.org/wikipedia/commons/6/63/Wikipedia-logo.png" 

-> URL 以 http:/ 开头

在我连接到 uploads.wikimedia.org 的代码中,如下所示:

                // connect to uploads.wikimedia.org
                ServerSocket.Connect(RemoteHost, 80);
                byte[] SendBuffer = Request.ToArray();

                // send the clients request to the server
                ServerSocket.Send(SendBuffer);

我不知道为什么它不起作用。任何帮助表示赞赏。我的完整代码位于 Github:Proxy_C_Sharp

4

1 回答 1

1

我才知道为什么。

根据第 5.2.1 章中的 HTTP/1.1 规范( http://www.w3.org/Protocols/rfc2616/rfc2616-sec5.html#sec5 ):

“为了在 HTTP 的未来版本中允许在所有请求中转换为 absoluteURI,所有 HTTP/1.1 服务器必须在请求中接受 absoluteURI 形式,即使 HTTP/1.1 客户端只会在对代理的请求中生成它们。”

我用一个小工具试了一下。如果我提出这样的要求:

GET /wikipedia/commons/6/63/Wikipedia-logo.png HTTP/1.1
Host: upload.wikimedia.org

有用。所以原因是维基百科不符合标准。它应该接受绝对网址。但如果我在没有代理的情况下访问该站点,它会起作用,因为浏览器仅使用代理的绝对 URI。如果没有配置代理,则使用相对代理。

于 2013-07-02T19:41:00.480 回答