第一个问题的链接可以在这里找到:
我对其进行了编辑,但被告知要作为新问题重新提交。但是使用上面的链接,您可以大致了解。继续下面的编辑。谢谢!
这个问题的新转折对不起。我有更多的时间来思考我们想要什么。所以...检测网页上的任何更改都会有点愚蠢,因为页面的时间相关元素会经常更改。相反,我想做的是能够检测页面中的文档。例如,如果该页面上有更改的 excel、word 文档或 pdf。所以,我会在这些文档上运行哈希,然后按某种时间表检查是否添加了新文档或是否修改了旧文档。有关如何检测页面上嵌入的文档并运行哈希的任何建议?再次感谢!