0

我正在尝试编写一段代码,它将比较两个 varchar 列,其中每个匹配的字符数量被加权并分配一个值,我可以稍后使用这个值来确定它们是否是“模糊”匹配. 到目前为止,我有一个去除数字和空格的函数,我认为我可以将其用作起点。有没有人有任何方向可以推动我或一些建议?谢谢布赖恩

4

3 回答 3

1

这取决于 Data 的类型。Soundex , Metaphone ,Double Metaphone 对人名有好处。但不适合比较街道地址,例如,editdistance(Levenshtein距离)可能用于模糊匹配街道地址。

Jaro-Winkler 距离和 Q-gram 是我想到的模糊匹配中使用的其他技术。

这是editdistance的一个实现。如果您想知道它是什么。

http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=51540&whichpage=2

于 2012-08-29T01:22:47.877 回答
1

您可能会查看 SOUNDEX 函数。

于 2012-08-28T23:00:14.130 回答
0

指向与@GilM 相同的方向,语音匹配算法,还有另一个选项:Double Metaphone。它不是作为 SOUNDEX 内置在 SQL Server 中的,而是在此处找到 T-SQL 版本

于 2012-08-28T23:37:02.817 回答