0

我需要在目录中的数千个文件中添加文件文本之类的标签,我使用 cat 进行了尝试,并将其输出到文件流中

for file in *
do
cat ../gau > temp;  //gau contain format i need to append in each file
echo $file >>temp;
cat ../gau_ >>temp ;//contains </DOCID>
cat $file >>temp;  
cat ../gau1  >> temp;  //this contain last sentence </DOC>
cat temp > $file
done

但是这样做很慢,请告诉我一个更好,更有效的方法来做到这一点.os不可能使用c.我们如何批量打开文件,然后处理它们并放回去,因为它可以加快这个过程,因为它可以从打开和我想写文件是瓶颈。

由于我们时间紧缺,是否有预制程序(高效且快速)来完成这项工作。

4

2 回答 2

0

这是一个快速的 python 代码,试试吧,它会比你的批处理脚本执行得更快:

import os

for dirname, dirnames, filenames in os.walk('/MY_DIRECTORY/'):
    for filename in filenames:
        with open(os.path.join(dirname, filename), "r+") as f:
             str = f.read() # read everything in the file
             f.seek(0) # rewind
             f.write("Prepended text tags" + str) # write the new line before
             f.close()

我还没有尝试过。

于 2011-03-15T12:46:43.383 回答
0

不要cat temp > $file,只是mv temp $file- 你不需要重写文件,只需重命名它。这当然是表现不佳的原因之一

for file in *; do
  { cat ../gau; echo $file; cat ../gau_ $file ../gau1; } > temp
  mv temp $file
done

您可能希望选择比“gau”、“gau_”和“gau1”更具描述性的文件名。

于 2011-03-15T17:37:13.297 回答