我创建了一个脚本来枚举目录及其下方的所有文件。我想通过使用 pv 添加一些进度反馈,因为我通常从根目录使用它。
问题是 find 在其时间输出 (%TT) 中始终包含小数秒,但我不想记录这么多细节。
如果我编写脚本一次完成所有事情,我会得到正确的输出。但是,如果我在“第二次”通过期间使用中间文件进行估计,结果会发生变化,我不明白为什么。
这个版本给出了正确的结果:
#!/bin/bash
find -printf "%11s %TY-%Tm-%Td %TT %p\n" 2> /dev/null |
# - Remove the fractional seconds from the time
# before: 4096 2011-01-19 22:43:51.0000000000 .
# after : 4096 2011-01-19 22:43:51 .
colrm 32 42 |
pv -ltrbN "Enumerating files..." |
# - Sort every thing by filename
sort -k 4
但是排序可能需要很长时间,所以我尝试了这样的方法,以获得更多反馈:
#!/bin/bash
TMPFILE1=$(mktemp)
TMPFILE2=$(mktemp)
# Erase temporary files before quitting
trap "rm $TMPFILE1 $TMPFILE2" EXIT
find -printf "%11s %TY-%Tm-%Td %TT %p\n" 2> /dev/null |
pv -ltrbN "Enumerating files..." > $TMPFILE1
LINE_COUNT="$(wc -l $TMPFILE1)"
#cat $TMPFILE1 | colrm 32 42 | #1
#cat $TMPFILE1 | cut -c1-31,43- | #2
#cut -c1-31,43- $TMPFILE1 | #3
#sed s/.0000000000// $TMPFILE1 | #4
awk -F".0000000000" '{print $1 $2}' $TMPFILE1 | #5
pv -lN "Removing fractional seconds..." -s $LINE_COUNT > $TMPFILE2
echo "Sorting list by filenames..." >&2
cat $TMPFILE2 |
sort -k 4
5个“解决方案”都不起作用。“.0000000000”部分留在输出中。
有人可以解释为什么吗?
我的最终解决方案是将切割操作与查找结合起来,只使用一个临时文件。只有排序是单独进行的。