我有两个带有名单的数据框
df1[name] -> number of rows 3000
df2[name] -> number of rows 64000
我正在使用模糊 wuzzy 使用以下代码从 df2 获取 df1 条目的最佳匹配:
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
matches = [process.extract(x, df1, limit=1) for x in df2]
但这需要很长时间才能完成。有没有更快的方法来对 pandas 中的字符串进行模糊匹配?