0

我的应用程序中的 HTTP 请求存在问题,例如,如果远程文件与本地文件大小相同(即使其修改时间不同,因为其内容已更改),尝试下载它会很快返回并且未下载较新的文件。

简而言之,我遵循的过程是:使用INTERNET_FLAG_RESYNCHRONIZE标志建立 HTTP 连接并调用 HttpSendRequest(); 然后检查 HTTP 状态代码并发现它是“200”。

  • 如果远程文件已更新,但仍与本地副本大小相同:运行应用程序后本地文件未更改。如果我在发送请求后打电话HttpQueryInfo()HTTP_QUERY_LAST_MODIFIED我,它会给我服务器文件的实际最后修改时间,我可以看到它与我试图覆盖的本地文件不同。
  • 如果远程文件被更新,并且文件大小与本地副本不同:它被下载并按预期覆盖本地副本。

这是代码的一个相当精简的版本,用于删除助手和错误检查:

// szAppName = our app name
HINTERNET hInternetHandle = InternetOpen( szAppName,
    INTERNET_OPEN_TYPE_PRECONFIG, NULL, NULL, 0 );
// szServerName = our server name
hInternetHandle = InternetConnect( hInternetHandle, szServerName,
    INTERNET_DEFAULT_HTTP_PORT, NULL, NULL, INTERNET_SERVICE_HTTP, NULL, 0 );

// szPath = the file to download
LPCSTR aszDefault[2] = { "*/*", NULL };
DWORD dwFlags = 0
| INTERNET_FLAG_IGNORE_REDIRECT_TO_HTTP
| INTERNET_FLAG_IGNORE_REDIRECT_TO_HTTPS
| INTERNET_FLAG_KEEP_CONNECTION
| INTERNET_FLAG_NO_AUTH
| INTERNET_FLAG_NO_AUTO_REDIRECT
| INTERNET_FLAG_NO_COOKIES
| INTERNET_FLAG_NO_UI
| INTERNET_FLAG_RESYNCHRONIZE;
HINTERNET hHandle = HttpOpenRequest( hInternetHandle, "GET", szPath, NULL,
    NULL, aszDefault, dwFlags, 0 );

DWORD dwTimeOut = 10 * 1000; // In milliseconds
InternetSetOption( hInternetHandle, INTERNET_OPTION_CONNECT_TIMEOUT,
    &dwTimeOut, sizeof( dwTimeOut ) );
InternetSetOption( hInternetHandle, INTERNET_OPTION_RECEIVE_TIMEOUT,
    &dwTimeOut, sizeof( dwTimeOut ) );
InternetSetOption( hInternetHandle, INTERNET_OPTION_SEND_TIMEOUT,
    &dwTimeOut, sizeof( dwTimeOut ) );
DWORD dwRetries = 5;
InternetSetOption( hInternetHandle, INTERNET_OPTION_CONNECT_RETRIES,
    &dwRetries, sizeof( dwRetries ) );

HttpSendRequest( hInternetHandle, NULL, 0, NULL, 0 );

因为我发现我可以查询远程文件的最后修改时间,并且发现它是准确的,所以我知道它实际上正在到达服务器。我认为如果文件过期INTERNET_FLAG_RESYNCHRONIZE,指定会强制文件重新同步。难道我都错了吗?这只是它应该如何工作吗?


编辑:我用数据包嗅探器做了一些调查,这里有一些额外的信息:

如果远程和本地文件完全一样,这就是交换:

GET /test.bmp HTTP/1.1
Accept: */*
If-None-Match: "1c1467112ee6ca1:369"
User-Agent: Internal Testing
Host: ****************
Connection: Keep-Alive

HTTP/1.1 304 Not Modified
Last-Modified: Tue, 27 Apr 2010 17:21:26 GMT
Accept-Ranges: bytes
ETag: "1c1467112ee6ca1:369"
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Tue, 27 Apr 2010 18:10:26 GMT

现在,如果远程文件已更改,但文件大小保持不变:

GET /test.bmp HTTP/1.1
Accept: */*
If-None-Match: "1c1467112ee6ca1:369"
User-Agent: Internal Testing
Host: ****************
Connection: Keep-Alive

HTTP/1.1 200 OK
Content-Length: 419958
Content-Type: image/bmp
Last-Modified: Tue, 27 Apr 2010 18:11:17 GMT
Accept-Ranges: bytes
ETag: "b65425835e6ca1:369"
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Tue, 27 Apr 2010 18:11:33 GMT
[Block of data]

因此,服务器确实在文件更改时发送了文件,但我的应用程序似乎仍然认为它没有更改。我认为问题在于我的应用程序如何处理响应;这不是我自己的代码,编写它的人很久以前就已经离开了。

我发现的一个问题是,在上述两种情况下,当我打电话时HttpQueryInfo()HTTP_QUERY_STATUS_CODE我会得到 200 回。但是,在上面的第一种情况下,我可以看到实际的服务器响应是 304,而不是 200。深入研究我们正在使用的代码,我发现它似乎试图通过进行文件大小比较来解决这个问题,并假设如果文件大小相同,则文件未更改;因此,我遇到的问题!

所以现在我的问题更简单了:为什么HttpQueryInfo()即使服务器返回 3XX 错误之一也会返回 200?我发现有些人在网上问了类似的问题,但他们要么没有收到回复,要么直接与网络浏览器打交道。

4

2 回答 2

1

根据 MSDN,INTERNET_FLAG_RESYNCHRONIZE仅“如果资源自上次下载后已被修改,则重新加载 HTTP 资源”。请参阅http://msdn.microsoft.com/en-us/library/aa383661(v=vs.85).aspx

返回的 200HttpQueryInfo()确实很奇怪 - 它应该返回真实的状态码。

如果可以,请更改代码以进行校验和比较,而不是文件大小比较。

如果没有,您可以查看更多内容:

于 2011-06-20T23:53:14.573 回答
1

我相信INTERNET_FLAG_RESYNCHRONIZE使用If-Modified-SinceHTTP 请求标头字段并检查状态代码,而 HTTP_QUERY_LAST_MODIFIED 将(我认为)只是执行 HEAD 请求并检查 HTTP 响应Last-Modified标头字段。

尝试 a HTTP_QUERY_IF_UNMODIFIED_SINCE& a HTTP_QUERY_LAST_MODIFIEDwithHttpQueryInfo()并比较结果 [作为旁注,如果你有一个 HTTP 嗅探器启动并运行它可能会为我们所有人清除一些事情......]。

作为一种快速而肮脏的解决方案,您可以在每次请求时使用INTERNET_FLAG_RELOAD而不是强制文件重新加载。INTERNET_FLAG_RESYNCHRONIZE

高温高压

于 2010-04-16T19:17:38.780 回答