1

检查网页更改的最简单方法是什么?我想每隔一段时间扫描一次网页,并将其与较旧的扫描进行比较。一个问题是我还需要扫描以忽略某些更改,例如一天中的时间等。我只想检查相关更新。

4

1 回答 1

4

我不会写代码,但我会给你我解决这个问题的过程:

  1. 检索页面的来源
  2. 替换掉页面中我们不想监控的所有部分
  3. 替换后计算源的 md5 或 sha1 哈希
  4. 将哈希与存储的哈希进行比较,看看它是否不同,如果页面已更新,则执行您需要执行的任何操作
  5. 存储新的哈希
于 2012-06-25T02:29:37.937 回答