3

我创建了一个脚本来枚举目录及其下方的所有文件。我想通过使用 pv 添加一些进度反馈,因为我通常从根目录使用它。

问题是 find 在其时间输出 (%TT) 中始终包含小数秒,但我不想记录这么多细节。

如果我编写脚本一次完成所有事情,我会得到正确的输出。但是,如果我在“第二次”通过期间使用中间文件进行估计,结果会发生变化,我不明白为什么。

这个版本给出了正确的结果:

#!/bin/bash

find -printf "%11s %TY-%Tm-%Td %TT %p\n" 2> /dev/null |
# - Remove the fractional seconds from the time
# before:       4096 2011-01-19 22:43:51.0000000000 .
# after :       4096 2011-01-19 22:43:51 .
colrm 32 42 |
pv -ltrbN "Enumerating files..." |
# - Sort every thing by filename
sort -k 4

但是排序可能需要很长时间,所以我尝试了这样的方法,以获得更多反馈:

#!/bin/bash

TMPFILE1=$(mktemp)
TMPFILE2=$(mktemp)

# Erase temporary files before quitting
trap "rm $TMPFILE1 $TMPFILE2" EXIT

find -printf "%11s %TY-%Tm-%Td %TT %p\n" 2> /dev/null |
pv -ltrbN "Enumerating files..." > $TMPFILE1
LINE_COUNT="$(wc -l $TMPFILE1)"

#cat $TMPFILE1 | colrm 32 42 |                   #1
#cat $TMPFILE1 | cut -c1-31,43- |                #2
#cut -c1-31,43- $TMPFILE1 |                      #3
#sed s/.0000000000// $TMPFILE1 |                 #4
awk -F".0000000000" '{print $1 $2}' $TMPFILE1 |  #5
pv -lN "Removing fractional seconds..." -s $LINE_COUNT > $TMPFILE2

echo "Sorting list by filenames..." >&2
cat $TMPFILE2 |
sort -k 4

5个“解决方案”都不起作用。“.0000000000”部分留在输出中。

有人可以解释为什么吗?

我的最终解决方案是将切割操作与查找结合起来,只使用一个临时文件。只有排序是单独进行的。

4

2 回答 2

3

您可以截断参数中的秒数以-printf使用字段精度说明符(至少使用 GNU find4.4.2):

find -printf "%11s %TY-%Tm-%Td %.8TT %p\n"

在“HH:MM:SS”中留下八个字符。

我的其余答案可能没有实际意义:

#1-5 不起作用的原因是输出wc包含文件名(尤其是空格)。空格导致pvwc命令中的文件名视为输入文件。命令行参数的优先级高于标准输入。因为它恰好与通过管道传递的输入文件相同,所以输出文件看起来像一个未处理的输入文件(因为它是,因为管道被忽略了)。

要仅捕获不带文件名的计数:

LINE_COUNT=$(wc -l < "$TMPFILE1")

以下是一些小的改进:

< $TMPFILE1 colrm 32 42 |                   #1 No need for cat

或者

colrm 32 42 < $TMPFILE1 |                   #1

< $TMPFILE1 cut -c1-31,43- |                #2

或者

cut -c1-31,43- < $TMPFILE1 |                #2

sed s/\.0000000000// $TMPFILE1 |            #4 The dot should be escaped
于 2011-01-25T07:32:32.653 回答
0

如果这是一个实际的工作工具,而不仅仅是一个玩具,那么我会一起放弃“进度反馈”......也许当它不会使你的生活变得复杂时,它会再次出现。与此同时,您可能花更多的时间试图弄清楚如何提供反馈,而不是您等待脚本返回所花费的时间。

如果您绝对必须提供某种反馈,那么只需回显“排序wc -l $TMPFILE行...”

你会感觉到从经验中对这么多行进行排序需要多长时间。

吻它,我的儿子,吻它。

于 2011-01-25T02:34:27.293 回答