0

我有下表

Address,                 City,          Data1,   Data2, Data3
123 North 5th Street,    San Francisco, A,       B,     C
123 N 5th Street,        San Francisco, [Blank], D,     [Blank]
123 North 5th St,        San Francisco, E,       F,     G

我想根据 2 个标准合并数据:地址的前 4 位数字和城市。
所以合并行看起来像:

123 North 5th Street, San Francisco, AE, BDF, CG

我有大约 6000 条记录,包括“重复”。我在 access 和 excel 中都有表格,任何帮助将不胜感激。

4

1 回答 1

0

您确定要对该条件进行匹配吗?例如,您是否希望将以下记录与旧金山北四街 123 号上方的那三个记录相匹配?

执行此操作的理想方法是首先对数据进行标准化,然后对其进行重复数据删除。例如,在新西兰,我们使用 PAF 文件(邮政地址文件)来标准化寻址并准确地为每条记录发布 DPID(递送点标识符)。然后,您将能够匹配数据以执行合并记录的第二步(这仍然是一个棘手的练习)。在美国,会有很多供应商以少量费用为您提供便利,我相信 Axciom 是该领域的全球参与者。

如果您不想这样做,另一种选择是使用第三方工具将这些记录与一些模糊逻辑进行匹配,而不是自己编写代码,我之前使用过一个名为 DQGlobal 的公司的 Excel 插件来运行数据和匹配记录。

于 2012-04-04T23:53:33.593 回答