我正在尝试stringdist
从 library验证 R 函数stringdist
。
使用示例
1 - stringdist('John J Smith', 'John Smith', method = 'jw', p = 0)
它返回0.9444444
其中p = 0
暗示不使用 Jaro-Winkler 的 Winkler 组件。
我正在尝试使用Wikipedia和本文档中显示的公式来重现此结果,但是似乎无法使我的手动计算对齐。
在下面的示例中,有 5 个半转置,因此floor(5/2)
结果为t = 2
.
有10个匹配字符,保证匹配字符之间的距离不大于5。
结果计算为: