我有文件file1
和file2
,其中file2
是file1
. 这意味着,如果我遍历file1
,则有些行在 in file2
,有些则不在,但没有行 infile2
不在 in file1
。一个文件中可能有几行内容相同。现在我想了解它们之间的区别,即所有行file1
都不在file2
.
diff(1) 不是答案, comm(1) 是。
(无论出于何种原因)
但据我了解,comm
需要先对文件进行排序。问题:两个文件都是有序的(没有排序!),并且需要保持这个顺序。所以我真正想要的是迭代file1
,并检查每一行,如果它也在file2
. 如果没有,请将其写入file3
. 如果相同的内容出现不止一次,就应该保留不止一次!
有没有办法用命令行来做到这一点?