0

我有一个 PDF 文件,它几乎每天(几乎)都以相同的名称和相同的 url 发布。

我想做的是:

  1. 仅在远程文件更新时才下载文件(这对我来说很困难,因为即使更新文件也始终保持相同的名称,可以检查文件大小吗?);
  2. 根据服务器的日期重命名文件(不是我的系统日期:我与服务器相差9小时);
  3. 自动化脚本以每 12 小时检查一次文件。

PS:我有一台Mac,两者都CURL安装WGET了。

谢谢!

4

1 回答 1

0

这里的解决方案是时间戳:http ://www.gnu.org/software/wget/manual/html_node/Time_002dStamping.html#Time_002dStamping

使用 wget -N 每 12 小时设置一次 cron 作业应该可以解决问题。这将检查 PDF 的标题,查看它是否是新的,如果不是,则不下载。由于它将使用 PDF 的时间戳下拉,因此您可以编写一个 bash 脚本来获取 ls -l 的输出,查找 mtime,并使用它来重命名文件。

于 2012-10-23T13:22:53.537 回答