sed - 如何在sed中合并三行连续的文本文件？

Question

我有一个文件，它由三行的重复序列组成，我想合并在一起。换句话说，我想将除三分之一以外的所有内容替换\n到空间中。例如，我想要转换输入

 href="file:///home/adam/MyDocs/some_file.pdf"
 visited="2013-06-02T20:40:06Z"
 exec="'firefox %u'"
 href="file:///home/adam/Desktop/FreeRDP-WebConnect-1.0.0.167-Setup.exe"
 visited="2013-06-03T08:50:37Z"
 exec="'firefox %u'"
 href="file:///home/adam/Friends/contact.txt"
 visited="2013-06-03T16:01:16Z"
 exec="'gedit %u'"
 href="file:///home/adam/Pictures/Screenshot%20from%202013-06-03%2019:10:36.png"
 visited="2013-06-03T17:10:36Z"
 exec="'eog %u'"

进入

 href="file:///home/adam/MyDocs/some_file.pdf" visited="2013-06-02T20:40:06Z" exec="'firefox %u'"
 href="file:///home/adam/Desktop/FreeRDP-WebConnect-1.0.0.167-Setup.exe" visited="2013-06-03T08:50:37Z" exec="'firefox %u'"
 href="file:///home/adam/Friends/contact.txt" visited="2013-06-03T16:01:16Z" exec="'gedit %u'"
 href="file:///home/adam/Pictures/Screenshot%20from%202013-06-03%2019:10:36.png" visited="2013-06-03T17:10:36Z" exec="'eog %u'"

不幸的是，该文件相当长，因此我不希望将整个文件加载到内存中，也不要将结果写回文件中 - 只需将连接的行打印到标准输出中，以便我可以进一步管道它。

我知道这可能 sed只是为它工作，但在我诚实地尝试之后，我仍然处于第一阶段；学习曲线对我来说太陡了。:-(

我做了一个粗略的基准测试，我发现该sed变体的速度几乎是原来的两倍。

time awk '{ printf "%s", $0; if (NR % 3 == 0) print ""; else printf " " }' out.txt >/dev/null

real    0m1.893s
user    0m1.860s
sys     0m0.028s

和

time cat out.txt | sed 'N;N;s/\n/ /g' > /dev/null

real    0m1.360s
user    0m1.264s
sys    0m0.236s

有趣的是：为什么sed需要比更多的内核时间awk？

out.txt 长 200MB，处理器是 Intel(R) Core(TM) i7-3610QM CPU @ 2.30GHz，在 Linux-Mint 14 上，内核为 3.8.13-030813-generic。

我需要这个来解析recently-used.xbelCinnamon 中最近打开的文件列表

如果您来这里是为了解决这个特定问题，这条线应该可以帮助您：

xpath -q  -e "//bookmark[*]/@href | //bookmark[*]/@visited | //bookmark[*]/info/metadata/bookmark:applications[1]/bookmark:application[1]/@exec"  recently-used.xbel | sed 's/href="\(.*\)"/"\1"/;N;s/visited="\(.*\)"/\1/;N;s/exec="\(.*\)"/"\1"/;s/\n/ /g' | xargs -n3 whatever-script-you-write

score 27 · Accepted Answer

27

这个怎么样：

 sed 'N;N;s/\n/ /g' file

于 2013-06-03T21:54:52.803 回答

score 16 · Accepted Answer

你可以awk很容易地做到这一点：

awk '{ printf "%s", $0; if (NR % 3 == 0) print ""; else printf " " }' file

基本思想是“打印每一行后跟一个空格，除非它是每三行，在这种情况下打印一个换行符”。

sed - 如何在sed中合并三行连续的文本文件？

2 回答 2

Related

Reference