这个问题可能会因为重复而被报告,但我已经做了很多研究并且没有得到任何令人满意的东西,所以我认为最好我准确地问它。
在我的项目中,我需要匹配地址字符串。我已经实现了几种字符串搜索算法,如 Soundex、Levenshtein 距离、Damerau–Levenshtein 距离、模糊搜索、字符频率匹配等。但是对于 St. 和 Street、Jr. 和 Junior 等字符串之间的搜索结果并不令人满意。我想过用 Streets 替换所有 St.,但这会导致像“St.”这样的地址出现问题。保罗街”。我应该怎么办?