我正在寻找一些与 MS SQL Server 兼容的重复数据删除软件。我有一个相当广泛和凌乱的表格,其中包含来自世界各地的所有不同语言的地址。该表设置为将欺骗作为父/子记录处理,因此需要一些处理匹配的功能(即不仅仅是删除欺骗)。
编辑:这是结构
ParentID | MasterID | PropertyName | Address1 | Address2 | PostalCode | City | StateProvinceCode | CountryCode | PhoneNumber
MasterID
每条记录都是唯一的。
ParentID
包含MasterID
每个条目的父记录,父记录是MasterID = ParentID
.
CountryCode
是两个字母的 ISO 国家代码(不是电话代码)。