我有一个数据框,我需要应用 Jaro winkler 距离,例如 -jaro.jaro_winkler_metric(u'SHACKLEFORD', u'SHACKELFORD')
数据框 -
col1 | col2 |
---|---|
价值1 | 价值2 |
价值3 | 价值4 |
所以基本上我有两列“col1”和“col2”,我需要将 value1 与 value 2 进行比较 - jaro.jaro_winkler_metric(u'value1', u'value2')
然后 value3 与 value4 等等,迭代应该继续到最后一个值并在新列中获得分数
预期输出 -
col1 | col2 | 分数 |
---|---|---|
价值1 | 价值2 | 0.88 |
价值3 | 价值4 | 0.77 |