给定两个名称的表示方式有所不同,是否有任何 API/工具/算法可以对名称的相似/不同程度进行评分?
Tim O' Reilly 是一个输入,T Reilly 是另一个输入。这两者之间返回的分数应该小于 Tim O' Reilly 和 Tim Reilly 之间的分数。
我正在寻找这样的分数计算机制。该算法应该能够处理的几个挑战是:
1)当输入名字作为输入时,名字和姓氏可以交换
2)可能有首字母代替名字
3)其中一个名字可能没有姓氏,而另一个可能同时有名字和姓氏。
...等等,这些都是名称表示中的常见错误。