0

我知道我可以检查上次修改时间

wget -S http://www.staticpage.com

只要页面是静态的。但是当对动态页面做同样的事情时,我总是得到现在的时间。

那么,询问网站是否自某个任意时间或上次更新页面时页面是否发生更改的侵入性较小的方法是什么。我显然可以下载整个页面并与我保存在文件中的内容进行比较,但我想减少开销。

4

1 回答 1

1

动态页面实际上是在更新每个页面加载。如果您想知道动态页面何时更新,您将需要查看页面本身或页面的 RSS 提要。您最好的选择通常是下载它并从最新帖子中解析出最新日期。

更新:如果您想限制下载页面时读取的数据量,可以使用以下内容:

curl http://someurl.com | head -c 512

Linux 将停止从流中读取并在 512 字节后使用它结束请求。由服务器来查看并停止传输。这可能会发生也可能不会发生,但至少您不会浪费更多带宽。

于 2014-01-29T13:59:58.570 回答