我正在尝试自动化下载过程。在此我想知道,特定文件的保存是否完成。场景是这样的。
- 使用 Chrome 或 Firefox(任何浏览器)打开站点地址
- 使用“Crtl + S”将页面保存到磁盘(我在 Windows 上工作)
- 现在如果页面很大,那么保存需要几秒钟。保存完成后,我想解析 html。
由于我无法控制浏览器保存功能,因此我不知道保存是否已完成。
我想的一个想法是,使用 while 循环获取文件的 md5sum,并检查前一个计算的结果,然后继续 while 循环,直到前一个和当前一个匹配的 md5 总和。我猜这不起作用,因为浏览器似乎首先尝试将文件保存在 tmp 文件中,然后将内容复制到指定的文件(或只是重命名文件)。
有任何想法吗?我使用 python 进行自动化,因此欢迎任何可以使用 python 实现的想法。
谢谢英德拉吉斯