我使用此处找到的 Jaro-Winkler 算法进行了模糊搜索(我已经尝试了所有这些算法),但努力验证特定案例
我的 2 个输入是:
onextwonge ltd
onex twonge
根据除一个 SO 答案之外的所有答案,得分约为0.9
.
另一个实现(由Jagannatha发布)返回0.0
,由于if (commonMatches != common2.Length)
我也尝试了这个实现0.8
根据这个网站0.4
,对于这些输入,我应该得到 Jaro-Winkler 的分数。
我的问题:如何验证其中哪些是正确的?
我似乎很清楚,这两个字符串实际上并没有太大区别,实际上它们完全相同,除了 5 个字符(2 个空格和结尾的 ltd)