-2

我有一个数据框,我需要应用 Jaro winkler 距离,例如 -jaro.jaro_winkler_metric(u'SHACKLEFORD', u'SHACKELFORD')

数据框 -

col1 col2
价值1 价值2
价值3 价值4

所以基本上我有两列“col1”和“col2”,我需要将 value1 与 value 2 进行比较 - jaro.jaro_winkler_metric(u'value1', u'value2')然后 value3 与 value4 等等,迭代应该继续到最后一个值并在新列中获得分数

预期输出 -

col1 col2 分数
价值1 价值2 0.88
价值3 价值4 0.77
4

1 回答 1

1
df['score'] = df.apply(lambda row : jaro.jaro_winkler_metric(row['col1'],
                     row['col2']), axis = 1)
于 2022-02-21T11:50:27.097 回答