vim - 根据部分行比较删除重复行

Question

我有一个包含数千行文本的文本文件，如下所示。

123 hello world
124 foo bar
125 hello world

我想通过检查该行的一个子部分来测试重复项。对于上面它应该输出：

123 hello world
124 foo bar

有没有一个vim命令可以做到这一点？

更新：我在Windows机器上，所以不能使用 uniq

score 8 · Accepted Answer

这是一个 bash 命令：

sort -k2 input | uniq -s4

在 vim 中，你可以调用上面的外部命令：

:%!sort -k2 % | uniq -s4

实际上，您可以使用以下命令在 vim 中排序：

:sort /^\d*\s/

排序后，使用此命令删除重复的行：

:%s/\v(^\d*\s(.*)$\n)(^\d*\s\2$\n)+/\1/

score 1 · Accepted Answer

使用 awk：

$ awk '!a[$2$3]++' file
123 hello world
124 foo bar

进入数组时的第一个元素将计数设置为 1，因此进一步出现的元素不会进入数组，因为否定使其为假。

score 0 · Accepted Answer

我不确定在 vim 中，但你可以用 uniq 命令做一些事情。它有一个 --skip-fields 参数，可用于跳过每行的第一部分。

$ cat test.txt
123 hello world
124 foo bar
125 hello world

$ cat test.txt | sort -k 2 | uniq --skip-fields=1 | sort
123 hello world
124 foo bar

score -1 · Accepted Answer

-1

在 VIM 中，我可以使用以下命令对重复项进行排序和删除

:sort u

于 2016-02-17T14:12:50.337 回答

4 回答 4