2

这个问题可能会因为重复而被报告,但我已经做了很多研究并且没有得到任何令人满意的东西,所以我认为最好我准确地问它。

在我的项目中,我需要匹配地址字符串。我已经实现了几种字符串搜索算法,如 Soundex、Levenshtein 距离、Damerau–Levenshtein 距离、模糊搜索、字符频率匹配等。但是对于 St. 和 Street、Jr. 和 Junior 等字符串之间的搜索结果并不令人满意。我想过用 Streets 替换所有 St.,但这会导致像“St.”这样的地址出现问题。保罗街”。我应该怎么办?

4

1 回答 1

1

创建一个字符串距离字典。示例:Distance('street','st')=0 。不过,您需要一些训练数据来创建这个字典。

于 2013-05-21T18:50:00.337 回答