1

我正在使用模糊模糊来比较两个不同数据框中的两列。我想在 df2 中的同一行但不同列中检索相应的值。例如:

如果 df1 A 列中的 i 与 df2 A 列的匹配率超过 50,我想检索 df2 B 列中的相应值。

我当前的代码:

import pandas as pd
import numpy as np
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
df1=pd.read_csv('C:\\Users\\nkurdob\\Desktop\\Sheet1.csv')
df2=pd.read_csv('C:\\Users\\nkurdob\\Desktop\\Sheet2.csv')


for i in range(len(df1)):
    em = df1['A'][i]
    test = fuzz.partial_ratio(em, df2['A']) 
    while test > 50:
        print df1['Fund Name'][i]==df2['B']

这进入了一个永无止境的输出——我每次都必须停止它。有谁知道如何根据一定的匹配率检索 df2 中的相应行?

谢谢纳扎尔

4

1 回答 1

1

替换whileif

您已经运行了 partial_ratio 函数并获得了名为test. 如果它> 50,则在您的代码的那部分中它将永远> 50,从而导致无限循环。

于 2017-02-27T19:18:25.363 回答