从 unix 终端,我们可以使用diff file1 file2
来查找两个文件之间的差异。是否有类似的命令来显示 2 个文件的相似性?(如有必要,允许使用许多管道。
每个文件包含一行带有字符串的句子;它们被排序并用 删除重复的行sort file1 | uniq
。
file1
: http: //pastebin.com/taRcegVn
file2
: http: //pastebin.com/2fXeMrHQ
并且输出应该输出出现在两个文件中的行。
output
: http: //pastebin.com/FnjXFshs
我可以使用 python 来做到这一点,但我认为放入终端有点太多了:
x = set([i.strip() for i in open('wn-rb.dic')])
y = set([i.strip() for i in open('wn-s.dic')])
z = x.intersection(y)
outfile = open('reverse-diff.out')
for i in z:
print>>outfile, i