sed - 使用 awk 解析数千个 xml 文件

Question

我有几千个文件，每个文件只包含一个很长的行。

我想将它们全部转换为一个文件，在 ID 字段中每行拆分一个条目，我可以处理几个文件，但是数百个文件花费的时间太长，而且似乎在数千个文件上崩溃。寻找一种无限的更快方式。

(find -type f -name '*.xml' -exec cat {} \;) | awk '{gsub("ID","\nID");printf"%s",$0}'

这个我也试过了。。

(find -type f -name '*.xml' -exec cat {} \;) | sed 's/ID/\nID/g'

我认为问题在于尝试使用替换而不是插入，或者它使用了太多内存。

谢谢

score 2 · Accepted Answer

我无法使用数千个文件对其进行测试，但不是cat在使用处理它们之前将所有数据放入内存，而是awk尝试一次运行awk其中一些文件，例如：

find . -type f -name "*.xml*" -exec awk '{gsub("ID","\nID");printf"%s",$0}' {} +

score 1 · Accepted Answer

2 回答 2