9

我正在尝试使用 System.Web 从服务器下载文件。它确实有效,但有些链接给我带来了麻烦。链接如下所示:

http://cdn.somesite.com/r1KH3Z%2FaMY6kLQ9Y4nVxYtlfrcewvKO9HLTCUBjU8IBAYnA3vzE1LGrkqMrR9Nh3jTMVFZzC7mxMBeNK5uY3nx5K0MjUaegM3crVpFNGk6a6TW6NJ3hnlvFuaugE65SQ4yM5754BM%2BLagqYvwvLAhG3DKU9SGUI54UAq3dwMDU%2BMl9lUO18hJF3OtzKiQfrC/the_file.ext

代码看起来基本上是这样的:

HttpWebRequest request = (HttpWebRequest)WebRequest.Create(link);
WebResponse response = request.getResponse();

getResponse() 总是抛出异常(错误 400 错误请求)。但是,我知道该链接有效,因为我可以使用 Firefox 毫无问题地下载该文件。

我还尝试使用 Uri.UnescapeDataString(link) 解码链接,但该链接甚至在 Firefox 中都不起作用。

其他链接以这种方式工作得很好..只是这些不起作用。

编辑:

好的,我使用wireshark发现了一些东西:

如果我使用 Firefox 打开链接,则会发送:

&ME3@"dM*PNyAo PA:]GET /r1KH3Z%2FaMY6kLQ9Y4nVxYp5DyNc49t5kJBybvjbcsJJZ0IUJBtBWCgri3zfTERQught6S8ws1a%2BCo0RS5w3KTmbL7i5yytRpn2QELEPUXZTGYWbAg5eyGO2yIIbmGOcFP41WdrFRFcfk4hAIyZ7rs4QgbudzcrJivrAaOTYkEnozqmdoSCCY8yb1i22YtEAV/epd_outpost_12adb.flv HTTP/1.1
Host: cdn.somesite.com
User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:12.0) Gecko/20100101 Firefox/12.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: de-de,de;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Connection: keep-alive

我认为只有第一行是问题所在,因为 WebRequest.Create(link) 解码了 url:

&MEz.@!dM/nP9@~P>.GET /r1KH3Z/aMY6kLQ9Y4nVxYp5DyNc49t5kJBybvjbcsJJZ0IUJBtBWCgri3zfTERQught6S8ws1a%2BCo0RS5w3KTmbL7i5yytRpn2QELEPUXZTGYWbAg5eyGO2yIIbmGOcFP41WdrFRFcfk4hAIyZ7rs6Mmh1EsQQ4vJVYUwtbLBDNx9AwCHlWDfzfSWIHzaaIo/epd_outpost_12adb.flv HTTP/1.1
User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:12.0) Gecko/20100101 Firefox/12.0
Host: cdn.somesite.com

( %2F 替换为 / )

另一个编辑:

我发现 Uri 类会自动解码 url: Uri uri = new Uri(link); //链接未解码 Debug.WriteLine(uri.ToString()); //链接在这里被解码。

我怎样才能防止这种情况?

在此先感谢您的帮助。

4

2 回答 2

20

默认情况下,Uri该类不允许在 URI 中使用转义/字符 ( %2f)(即使在我阅读RFC 3986时这似乎是合法的)。

Uri uri = new Uri("http://example.com/embed%2fded");
Console.WriteLine(uri.AbsoluteUri); // prints: http://example.com/embed/ded

(注意:不要使用 Uri.ToString来打印 URI。)

根据Microsoft Connect 上此问题的错误报告,此行为是设计使然,但您可以通过将以下内容添加到 app.config 或 web.config 文件来解决此问题:

<uri>
  <schemeSettings>
    <add name="http" genericUriParserOptions="DontUnescapePathDotsAndSlashes" />
  </schemeSettings>
</uri>

(由于WebRequest.Create(string)只是委托给WebRequest.Create(Uri),因此无论调用哪种方法,都需要使用此解决方法。)

于 2012-05-02T14:10:31.587 回答
3

这在 .NET 4.5 中已经改变。默认情况下,您现在可以使用转义斜杠。我在这里的评论中发布了更多信息(包括截图):GETting a URL with an url-encoded slash

于 2013-12-23T02:44:18.817 回答