我想在下载之前获取 http:/.../file 的大小。该文件可以是网页、图像或媒体文件。这可以用 HTTP 标头完成吗?如何仅下载文件 HTTP 标头?
4 回答
是的,假设您正在与之交谈的 HTTP 服务器支持/允许:
public long GetFileSize(string url)
{
long result = -1;
System.Net.WebRequest req = System.Net.WebRequest.Create(url);
req.Method = "HEAD";
using (System.Net.WebResponse resp = req.GetResponse())
{
if (long.TryParse(resp.Headers.Get("Content-Length"), out long ContentLength))
{
result = ContentLength;
}
}
return result;
}
如果不允许使用 HEAD 方法,或者服务器回复中不存在 Content-Length 标头,则确定服务器上内容大小的唯一方法是下载它。由于这不是特别可靠,因此大多数服务器都会包含此信息。
这可以用 HTTP 标头完成吗?
是的,这是要走的路。如果提供了信息,则它在标题中作为Content-Length
. 但是请注意,情况不一定如此。
可以使用HEAD
请求而不是GET
. 也许下面的代码有帮助:
HttpWebRequest req = (HttpWebRequest)WebRequest.Create("http://example.com/");
req.Method = "HEAD";
long len;
using(HttpWebResponse resp = (HttpWebResponse)(req.GetResponse()))
{
len = resp.ContentLength;
}
注意对象内容长度的HttpWebResponse
属性——无需Content-Length
手动解析标题。
请注意,并非每个服务器都接受HTTP HEAD
请求。获取文件大小的另一种方法是HTTP GET
调用服务器,仅请求文件的一部分以保持响应较小,并从作为响应内容标头的一部分返回的元数据中检索文件大小。
该标准System.Net.Http.HttpClient
可用于实现此目的。通过在请求消息头上设置字节范围来请求部分内容:
request.Headers.Range = new RangeHeaderValue(startByte, endByte)
服务器以包含请求范围以及整个文件大小的消息进行响应。此信息在响应内容标头 ( response.Content.Header
) 中返回,键为“Content-Range”。
以下是响应消息内容标头中内容范围的示例:
{
"Key": "Content-Range",
"Value": [
"bytes 0-15/2328372"
]
}
在此示例中,标头值意味着响应包含字节 0 到 15(即总共 16 个字节),并且文件总共有 2,328,372 个字节。
这是此方法的示例实现:
public static class HttpClientExtensions
{
public static async Task<long> GetContentSizeAsync(this System.Net.Http.HttpClient client, string url)
{
using (var request = new System.Net.Http.HttpRequestMessage(System.Net.Http.HttpMethod.Get, url))
{
// In order to keep the response as small as possible, set the requested byte range to [0,0] (i.e., only the first byte)
request.Headers.Range = new System.Net.Http.Headers.RangeHeaderValue(from: 0, to: 0);
using (var response = await client.SendAsync(request))
{
response.EnsureSuccessStatusCode();
if (response.StatusCode != System.Net.HttpStatusCode.PartialContent)
throw new System.Net.WebException($"expected partial content response ({System.Net.HttpStatusCode.PartialContent}), instead received: {response.StatusCode}");
var contentRange = response.Content.Headers.GetValues(@"Content-Range").Single();
var lengthString = System.Text.RegularExpressions.Regex.Match(contentRange, @"(?<=^bytes\s[0-9]+\-[0-9]+/)[0-9]+$").Value;
return long.Parse(lengthString);
}
}
}
}
WebClient webClient = new WebClient();
webClient.OpenRead("http://stackoverflow.com/robots.txt");
long totalSizeBytes= Convert.ToInt64(webClient.ResponseHeaders["Content-Length"]);
Console.WriteLine((totalSizeBytes));