我有一个文本文件,其中包含字段 1 中的可变长度键字段和字段 2 中的其他数据。这些字段由制表符 ("\t") 分隔。关键字段包含空格。文件按关键字段排序。
我想对此进行过滤以创建一个文件,该文件仅包含具有重复键字段(即字段 1)的那些记录,另外还可以使用空行分隔记录组。
例如
01001|XYZ ZY|\tFOO MAN CHU\n
01001|XYZ ZY|\tBAR BAZ\n
01001|ZZZYYYXX|\tYACKETY YACK\n
01001|ZZZYYYXX|\tBOBBITY BOP\n
01001|ZZZYYYXX|\tTESTING TESTING\n
...ETC。换句话说,uniq -d -D
如果它为备用字段定界符或可变长度字段提供任何选项,那么它会做什么!
有没有办法在使用现成的 Unix 过滤器的命令中完成这个?