我目前有两个 CSV 文件,它们在每个 csv 的第 1 列中包含数千个值。这些值是字母数字大写字符。
我当前的 python 脚本为每个 CSV 填充一个集合以单独获取唯一值,然后比较这两个集合,然后仅识别两个 CSV 中存在的条目:-
import csv
Cell1 = [x[0] for x in csv.reader(open('C:\Documents and Settings\Me\Desktop\CSV1.csv','r'))]
Cell2 = [y[0] for y in csv.reader(open('C:\Documents and Settings\Me\Desktop\CSV2.csv','r'))]
uniqueSet = set(Cell1) & set(Cell2)
print uniqueSet
以上工作完全没有问题,并撤回了我期望的所有条目。不过,我想进一步开发一套脚本,基本上在两个 CSV 之间进行比较,并确定除了一个字符之外相同的条目。例如,如果 CSV1 包含“ABCDE123”而 CSV2 包含“ABCDE124”,我希望这也能返回一个匹配项。
不幸的是,字符串的长度会有所不同,因为我正在考虑运行某种代码来比较 7 个字符中的 6 个字符是否相等。
关于从哪里开始的任何建议?