我正在研究地址标准化的应用程序。我有一个包含 8000 行的数据库表,每行包含一个地址。我的目标是检查每个地址与数据库中的每个其他地址是否相似但不完全匹配,然后输出结果。
目前,我的方法是将 8000 行加载到一个数组中,并使用嵌套的 foreach 循环将地址传递给一个函数,该函数将在找到匹配项时返回 true(并将匹配项存储在数组中以在循环后输出所有匹配项) .
问题是,这需要永远加载。这通常是你们如何处理这个问题,还是我应该寻找其他解决方案?
示例:“123 garden st. ste. 140”应该匹配“123 garden street suite 140”,数据库排序的想法让我思考......
非常感谢所有帮助!,特雷弗·卡瓦诺