我正在尝试在 SQL Server 2012 DQS 中构建知识库。在我试图通过 DQS 运行的原始数据中,我有一个字段是一个全名字段,不幸的是它可以包含人名和公司名。我想知道是否有人对如何使用 DQS 清理和解析此字段而无需购买参考数据服务提出建议,以便如果它是公司名称,它将整个字段放入 FirstName 或 LastName 域,但如果它不是公司name 然后它将整个名称解析到适当的域中。
我设置了一个名为 FullName 的复合域,它由 FirstName、MiddleName 和 LastName 域组成,并将其映射到我的原始数据。然后,我使用基于复合领域知识的解析来尝试将这些值解析到各自的字段中,但不幸的是,它试图解析公司名称,就好像他们是人一样,所以我得到了很多姓氏,比如“& Associates Inc”等。
解决这个问题的最简单方法似乎是创建一个业务词域并具有一个复合域规则,基本上说,如果 FullName 域中的任何单词在 BusinessWord 域中,则将整个名称放入 FirstName域,否则尝试将名称解析为第一个,中间,最后一个。这种类型的查找是否超出了 DQS 的能力?
到目前为止,我唯一能找到的 DQS CD 规则是创建硬编码的规则,即如果城市是“伦敦”,则将国家/地区更改为“英格兰”,但我想要一个更动态的规则,如果 BusinessWord In FullName 然后把整个东西放在名字里。只是想知道尝试 DQS 的人是否遇到过这样的问题,以及它是否可以解决而无需为参考数据服务支付一大笔钱。
如果你不能用这个东西清理姓名和地址,那么它有什么用呢?
提前致谢。