我每天都在类似于 /tmp/data/$yearmonth/$day/$hour 的目录结构中收集一些 tsv 文件。所以 /tmp/data/$yearmonth/$day 里面有 24 个目录
我有这样的shell脚本:
yearmonth=`date -d "-2 days" +%Y%m`
day=`date -d "-2 days" +%d`
files=()
cd /tmp/data/$yearmonth/$day
for i in `ls -a */*.tsv`
do
files+=($i)
done
数组文件中存储了所有 tsv 文件。我想将所有这些 tsvfiles “cat”到一个 tsvfiles 并想对其执行 sort|uniq -c 。我怎么做?随着 tsv 文件变得巨大,猫会变得非常慢。另一种选择可能是什么。谢谢