7

max-age阅读 Http Cache rfc后,我对行为有疑问。

设想:

用户代理

GET /foo

源服务器响应标头

cache-control: max-age=120

服务器告诉用户代理请求的资源应该在 2 分钟后重新验证。

1 分几秒后,用户代理发出另一个请求,指定 amax-age为 1 分钟:

用户代理

cache-control: max-age=60
GET /foo

据我了解,这个请求应该绕过用户代理缓存。
为什么?
虽然 Origin Server 告诉客户端该资源应该被缓存 2 分钟,但用户代理需要一个最多 1 分钟旧的资源 ( max-age = 60)。
从第一次开始 1 分几秒后GET,该资源无效(从用户代理的角度来看),请求应直接发送到源服务器(或任何其他缓存层)。

我对吗?是否可以从用户代理中指定max-age大于零的值?普通浏览器是否支持/尊重它?

在我工作的地方,我们有一个像这样工作的 .NET 自定义缓存机制;max-age客户端可以在需要“最多”X 秒的缓存中的资源时指定一个。

4

2 回答 2

7

没有必要怀疑。 RFC7234 第 5.2.1.1 节包含一个max-age=5当然大于零的示例。定义也很清楚(强调我的):

“max-age”请求指令表示客户端不愿意接受年龄大于指定秒数的响应。

“指定的秒数”可以是任何非负整数(在第 1.2.1 节中定义)。所以答案是肯定的。

此外,我上面引用的定义还解释了您的场景中的缓存行为。但在此之前,我应该更正以下内容:

服务器告诉用户代理请求的资源应该在 2 分钟后重新验证。

不正确。

max-age=120指令意味着服务器告诉所有缓存,而不是用户代理,响应必须在 2 分钟后被认为是陈旧的。从第 5.2.2.8 节(强调我的):

“max-age”响应指令指示响应在其年龄大于指定秒数后将被视为陈旧。

如您所见,没有重新验证要求。如果直到 10 分钟后才有对同一资源的请求,则直到 10 分钟后才会进行任何重新验证。

此外,从第 5.2 节(强调我的):

“Cache-Control”标头字段用于为请求/响应链中的缓存指定指令。

只是缓存,而不是用户代理。

请求/响应链中的每个参与者都会收到具有相同 Cache-Control 标头的相同响应,但 Cache-Control 标头的预期接收者只是缓存。请记住,仅仅因为您收到了它,并不意味着它适合您。

对于您的场景的其余部分,您的评估是正确的。我将在这里引用它:

1 分几秒后,用户代理发出另一个请求,指定 amax-age为 1 分钟:

...

据我了解,这个请求应该绕过用户代理缓存。为什么?

因为在请求的时候,存储响应的时间超过了 60 秒。很明显,如果存储响应的时间为 65 秒,则它不能用于满足带有max-age=60指令的请求。因此,缓存只是服从它接收到的指令。

事实上,任何符合标准的 HTTP 缓存,无论是集成在浏览器中还是单独的,都必须遵守它收到的指令,如第 5.2 节所述(大写强调来自源代码,不是我的):

缓存必须遵守本节中定义的 Cache-Control 指令的要求。

根据您的描述,您使用的自定义缓存机制似乎符合标准。所以,我对开发人员的补充,特别是如果“定制”是指“内部开发”。

于 2017-09-26T17:14:23.780 回答
1

来自RFC2616 max-age

  When an intermediate cache is forced, by means of a max-age=0
  directive, to revalidate its own cache entry, and the client has
  supplied its own validator in the request, the supplied validator
  might differ from the validator currently stored with the cache
  entry. In this case, the cache MAY use either validator in making
  its own request without affecting semantic transparency.

  However, the choice of validator might affect performance. The
  best approach is for the intermediate cache to use its own
  validator when making its request. If the server replies with 304
  (Not Modified), then the cache can return its now validated copy
  to the client with a 200 (OK) response. If the server replies with
  a new entity and cache validator, however, the intermediate cache
  can compare the returned validator with the one provided in the
  client's request, using the strong comparison function. If the
  client's validator is equal to the origin server's, then the
  intermediate cache simply returns 304 (Not Modified). Otherwise,
  it returns the new entity with a 200 (OK) response.

  If a request includes the no-cache directive, it SHOULD NOT
  include min-fresh, max-stale, or max-age.

从 RFC 的最后几行:

如果请求包含 no-cache 指令,则不应包含 min-fresh、max-stale 或 max-age。

来自13.2.6 消除多重响应的歧义部分

When a client tries to revalidate a cache entry,
and the response it receives contains a Date header that
appears to be older than the one for the existing entry, 
then the client SHOULD repeat the request 
unconditionally, and include

    Cache-Control: max-age=0

to force any intermediate caches to validate their copies directly with the origin server, or

    Cache-Control: no-cache

to force any intermediate caches to obtain a new copy from the origin server.

If the Date values are equal, then the client MAY use either response
(or MAY, if it is being extremely prudent, request a new response).
Servers MUST NOT depend on clients being able to choose 
deterministically between responses generated during the same
second, if their expiration times overlap.

我的理解是,从客户端(用户代理)max-age=0可以用作使用最新存储版本的机制,相比之下no-cache,它将重新获取资源。

curl -I -H 'Cache-Control: no-cache' http://example.com 

因此,如果使用max-age大于零的值,则应使用与标头中接收到的日期之间的差异匹配的存储版本和max-age.

不确定我是否正确,但我不明白。

补充类似的问题:Cache-Control: max-age=0 和 no-cache 有什么区别?

于 2017-09-25T10:58:25.803 回答