我正在尝试制定算法来判断网络上的非二进制文件是否已更改。我打算去:
- 标题中的 LastModified 日期时间,然后如果这些不存在则回退到
- 来自标头的内容长度
然而,我发现对于许多网站来说,HTML 页面的 LastModified 实际上只是使用当前的 DateTime,因此该方法不起作用(即会导致页面总是在变化)我认为...... ?
那么什么是好的算法呢?怎么样?
IF response.ContentType.StartsWith("text/html") <== or should this just be "text"
THEN:
Check based on comparing text content before & after
ELSE:
IF LastModified dates are OK
Compare based on LastModified dates
ELSE
Compare based on ContentLength
谢谢