python - 如何为 2 个 excel 数据框创建 SequenceMatcher 循环

翻译自：https://stackoverflow.com/questions/62062348 2020-05-28T10:20:14.803

78 次

Hej 我目前有来自 2 个不同 excel 文件的 2 个数据帧

a=df_Web_Customer
b=df_Batchlog

例子

dfa = pd.DataFrame([[Casper May 16 2020], [Kasper Apr 1 2014], [Jonas Jan 15 2016]], columns=['Name'])

dfb = pd.DataFrame([[Casper May 16 2020], [Jonas Apr 1 2014], [Jona Jan 5 2016]], columns=['Name'])

我有一个可以相互比较 2 个输入的函数：SequenceMatcher

我如何一次从 Dataframe a 中取出一个单元格并将其与 Dataframe b 中的每个单元格匹配？

我的最终目标是开发一个 if 语句对最大匹配进行排序，但我无法在堆栈上找到任何类似的案例，所以我希望可以提供任何帮助:)

编码：

from difflib import SequenceMatcher
import pandas as pd
#import zip 

#Load Web customer to Data frame
data_web_customer = pd.read_excel (r'NewWeb_customer.xlsx')
df_Web_Customer = pd.DataFrame(data_web_customer, columns= ['Name'])

#Load Batchlog to Data frame
data_Batchlog = pd.read_excel (r'BatchlogTestName.xlsx')
df_Batchlog = pd.DataFrame(data_Batchlog, columns= ['Name'])

a=df_Web_Customer
b=df_Batchlog

#LOOP the SIMILAR FUNCTION through each cell??
    def similar(a, b):
        return SequenceMatcher(None, a, b).ratio()

python - 如何为 2 个 excel 数据框创建 SequenceMatcher 循环

0 回答 0

Related

Reference