-2

我正在尝试编写一个程序来打开文件,读取内容并将它们与打开的其他文件进行比较。我需要显示它们是否不够相似、相似或彼此的精确副本。我正在尝试使用 filecmp 模块,但它对我不起作用。这是我到目前为止所拥有的:

import filecmp

#Opens selected files
file1 = open('file1.txt')
file2 = open('file2.txt')

#Compares different files
filecmp.cmp('file1','file2', shallow=False)

#Closes Files
filecmp.clear_cache()
close.file1
close.file2

有什么建议么?

4

2 回答 2

3

filecmp是使用错误的工具
试试这个:
1. 将每个文件的内容加载到列表中
2. 将列表转换为集合 3. 从另一个集合中减去一个集合 4. 结果提供了您可以分析的两者之间的差异.

例如:

list1 = set(line.strip() for line in open("file1.txt"))
list2 = set(line.strip() for line in open("file2.txt"))
diff1 = list1 - list2 # subtract 1 set from the other for the difference
diff2 = list2 - list1 # subtract 1 set from the other for the difference
save = open("diff.txt",'w') # Write file differences details for analysis
for i in diff1:
    save.write(i+'\n')
save.close()
save = open("diff2.txt",'w') # Write file differences details for analysis
for i in diff2:
    save.write(i+'\n')
save.close()

或查看difflib https://docs.python.org/3.5/library/difflib.html#difflib.Differ

于 2015-09-26T08:08:01.273 回答
0
>>> import filecmp
>>> filecmp.cmp('C://Desktop/a.txt', 'C://Desktop/b.txt')
True
>>> 

在这种情况下,我有 2 个文本文件a.txtb.txt. 两个文件都包含相同的一行string.

如果我将string其中一个文件中的内容更改为不同的内容,则输出为False

于 2015-09-26T07:51:33.337 回答