我们正在做很多工作,试图协调大约 1,000 个重复的制造商名称和 1,000,000 个重复的零件编号。出现的一件事是如何“匹配”诸如“有限”与“有限公司”之类的东西。与“有限公司”
目的是让应用程序将这些匹配的项目协调为标准格式。所以:
ACME 有限公司 ACME 有限公司 ACME 有限公司
应该全部和解到 ACME Ltd.
这也将用于防止将来输入其他重复项。
有关如何在 SQL Server 中完成此模式匹配的任何建议?任何已知的算法来查找具有映射等价的项目等......?
谢谢!
埃里克。