假设我有 2 个 excel 文件,每个文件都包含一列名称和日期
Excel 1:
Name
0 Bla bla bla June 04 2018
1 Puppy Dog June 01 2017
2 Donald Duck February 24 2017
3 Bruno Venus April 24 2019
Excel 2:
Name
0 Pluto Feb 09 2019
1 Donald Glover Feb 22 2020
2 Dog Feb 22 2020
3 Bla Bla Feb 22 2020
我想将第 1 列中的每个单元格与第 2 列中的每个单元格匹配,然后找到最大的相似性。
以下函数将给出两个输入相互匹配的百分比值。
SequenceMatcher 代码示例:
from difflib import SequenceMatcher
def similar(a, b):
return SequenceMatcher(None, a, b).ratio()
x = "Adam Clausen a Feb 09 2019"
y = "Adam Clausen Feb 08 2019"
print(similar(x,y))
输出:0.92