6

我之前使用了一个简单的 find 命令来删除最近 x 天(在本例中为 3 天)内未访问的 tar 文件:

find /PATH/TO/FILES -type f -name "*.tar" -atime +3 -exec rm {} \;

我现在需要按访问日期的顺序删除来改进这个脚本,而且我的 bash 写作技巧有点生疏。这是我需要它做的事情:

  1. 检查目录 /PATH/TO/FILES 的大小
  2. 如果 1) 中的大小大于 X 大小,则按访问日期获取文件列表
  3. 按顺序删除文件,直到大小小于 X

这里的好处是缓存和备份目录,我只会删除我需要将其保持在限制范围内的内容,而如果一天特别大,简化的方法可能会超出大小限制。我猜我需要使用 stat 和 bash for 循环?

4

3 回答 3

10

我改进了 brunner314 的示例并修复了其中的问题。

这是我正在使用的工作脚本:

#!/bin/bash
DELETEDIR="$1"
MAXSIZE="$2" # in MB
if [[ -z "$DELETEDIR" || -z "$MAXSIZE" || "$MAXSIZE" -lt 1 ]]; then
    echo "usage: $0 [directory] [maxsize in megabytes]" >&2
    exit 1
fi
find "$DELETEDIR" -type f -printf "%T@::%p::%s\n" \
| sort -rn \
| awk -v maxbytes="$((1024 * 1024 * $MAXSIZE))" -F "::" '
  BEGIN { curSize=0; }
  { 
  curSize += $3;
  if (curSize > maxbytes) { print $2; }
  }
  ' \
  | tac | awk '{printf "%s\0",$0}' | xargs -0 -r rm
# delete empty directories
find "$DELETEDIR" -mindepth 1 -depth -type d -empty -exec rmdir "{}" \;
于 2012-08-16T05:50:10.690 回答
5

这是我想出的一种简单,易于阅读和理解的方法:

DIRSIZE=$(du -s /PATH/TO/FILES | awk '{print $1}')
if [ "$DIRSIZE" -gt "$SOMELIMIT" ]
  then
    for f in `ls -rt --time=atime /PATH/TO/FILES/*.tar`; do
    FILESIZE=`stat -c "%s" $f`
    FILESIZE=$(($FILESIZE/1024))

    DIRSIZE=$(($DIRSIZE - $FILESIZE))
    if [ "$DIRSIZE" -lt "$LIMITSIZE" ]; then
        break
    fi
done
fi
于 2012-07-26T03:54:47.890 回答
1

我不需要使用循环,只需仔细应用 stat 和 awk。下面详细解释,先上代码:

find /PATH/TO/FILES -name '*.tar' -type f \
| sed 's/ /\\ /g' \
| xargs stat -f "%a::%z::%N" \
| sort -r \
| awk '
  BEGIN{curSize=0; FS="::"}
  {curSize += $2}
  curSize > $X_SIZE{print $3}
  '
| sed 's/ /\\ /g' \
| xargs rm

请注意,这是一个逻辑命令行,但为了理智起见,我将其拆分。

它以基于上述命令的查找命令开始,没有将其限制为超过 3 天的文件的部分。它通过管道将其传递给 sed,以转义 find 返回的文件名中的任何空格,然后使用 xargs 对所有结果运行 stat。-f "%a::%z::%N" 告诉 stat 要使用的格式,第一个字段是上次访问的时间,第二个字段是文件大小,第二个字段是文件名第三。我使用 '::' 分隔字段,因为这样处理文件名中的空格更容易。Sort 然后在第一个字段上对它们进行排序,使用 -r 来反转排序。

现在我们有一个我们感兴趣的所有文件的列表,按照从最近访问到最早访问的顺序排列。然后 awk 脚本在遍历列表时将所有大小相加,并在超过 $X_SIZE 时开始输出它们。不以这种方式输出的文件将被保留,其他文件名再次转到 sed 以转义任何空格,然后转到运行 rm 它们的 xargs。

于 2012-07-23T21:56:10.560 回答