0

我希望在 TSQL(没有 MDS)中实现一个比较全名的模糊匹配算法。这些名称来自单独的手动输入,无法控制输入的内容。其中一个系统也倾向于切断名称的结尾,因为它的字符限制较低。作为我正在查看的数据类型的一个极端示例:

System1Name                System2Name
-----------                -----------
Katherine G Livingstone    Kat George Livingst

我绝对不是在这里寻找完美的匹配,但希望有人可以推荐这样的算法。我研究了 Jaro-Winkler 距离和 Soundex,但我不确定我是否最好使用基于距离的算法或语音算法来处理此类数据。想法?

4

0 回答 0