1

基于这个问题Group files and pipe to awk command

我有一组这样的文件:-

-rw-r--r-- 1 root root 497186 Apr 21 13:17 2012_03_25
-rw-r--r-- 1 root root 490558 Apr 21 13:17 2012_03_26
-rw-r--r-- 1 root root 488797 Apr 21 13:17 2012_03_27
-rw-r--r-- 1 root root 316290 Apr 21 13:17 2012_03_28
-rw-r--r-- 1 root root 490081 Apr 21 13:17 2012_03_29
-rw-r--r-- 1 root root 486621 Apr 21 13:17 2012_03_30
-rw-r--r-- 1 root root 490904 Apr 21 13:17 2012_03_31
-rw-r--r-- 1 root root 491788 Apr 21 13:17 2012_04_01
-rw-r--r-- 1 root root 488630 Apr 21 13:17 2012_04_02

根据链接问题中的答案,我有一个包含以下代码的脚本,可以正常工作:-

DIR="/tmp/tmp"
for month in $(find "$DIR" -maxdepth 1 -type f | sed 's/.*\/\([0-9]\{4\}_[0-9]\{2\}\).*/\1/' | sort -u); do
  echo "Start awk command for files $month"
  power=$(awk -F, '{ x += $1 } END { print x/NR }' "$DIR/${month}"_[0-3][0-9])
  echo $power
done

下面的命令本身会返回一个这样的列表:-

find /tmp/tmp -maxdepth 1 -type f | sed 's/.*\/\([0-9]\{4\}_[0-9]\{2\}\).*/\1/' | sort -u

2011_05
2011_06
2011_07
2011_08
2011_09
2011_10
2011_11
2011_12
2012_01
2012_02
2012_03
2012_04

find 命令使用 GLOB 将一组文件传递给 AWK,以便作为批处理进行处理。

基于此,我希望能够运行以下剪切命令

head -1 FirstFile | date -d "`cut -d, -f7`" +%s

tail -1 LastFile | date -d "`cut -d, -f7`" +%s

这些需要为每组的第一个和最后一个文件运行

因此,对于上面的 2012_03,需要为 2012_03_25 文件运行头部,而需要为 2012_03_31 运行尾部,因为这些是 3 月份集合中的第一个和最后一个文件。

所以基本上我需要能够获得每批的第一个和最后一个文件。

我希望我已经说得很清楚了,如果没有,请发表评论。

4

1 回答 1

2
DIR="/tmp/tmp"
for month in $(find "$DIR" -maxdepth 1 -type f | sed 's/.*\/\([0-9]\{4\}_[0-9]\{2\}\).*/\1/' | sort -u); do
      echo "Start awk command for files $month"
      IFS=, read start end power < <(awk -F, 'BEGIN{OFS = ","} NR == 1 {printf "%s,", $7} { x += $1; d = $7 } END { print d, x/NR }' "$DIR/${month}"_[0-3][0-9])
      echo $power
      date -d "$start" +%s
      date -d "$end" +%s
done

以下是使用 here-doc 的方法,它应该适用于大多数 shell:

      read start end power <<EOF
$(awk -F, 'NR == 1 {printf "%s ", $7} { x += $1; d = $7 } END { print d, x/NR }' "$DIR/${month}"_[0-3][0-9]))
EOF
于 2012-04-22T11:18:54.350 回答