我有一个 PDF 文件,它几乎每天(几乎)都以相同的名称和相同的 url 发布。
我想做的是:
- 仅在远程文件更新时才下载文件(这对我来说很困难,因为即使更新文件也始终保持相同的名称,可以检查文件大小吗?);
- 根据服务器的日期重命名文件(不是我的系统日期:我与服务器相差9小时);
- 自动化脚本以每 12 小时检查一次文件。
PS:我有一台Mac,两者都CURL
安装WGET
了。
谢谢!
这里的解决方案是时间戳:http ://www.gnu.org/software/wget/manual/html_node/Time_002dStamping.html#Time_002dStamping
使用 wget -N 每 12 小时设置一次 cron 作业应该可以解决问题。这将检查 PDF 的标题,查看它是否是新的,如果不是,则不下载。由于它将使用 PDF 的时间戳下拉,因此您可以编写一个 bash 脚本来获取 ls -l 的输出,查找 mtime,并使用它来重命名文件。