首先,我想补充一点,在使用任何形式的语音/模糊匹配算法时都应该非常小心,因为这种逻辑正是如此,模糊或更简单地说;可能不准确。用于匹配公司名称时尤其如此。
一个好的方法是从其他数据中寻求佐证,例如地址信息、邮政编码、电话号码、地理坐标等。这将有助于确认您的数据被准确匹配的可能性。
有很多与 B2B 数据匹配相关的问题需要在这里解决,我在我的博客(也是更新的文章)中写了更多关于公司名称匹配的内容,但总的来说,关键问题是:
- 查看整个字符串是没有帮助的,因为公司名称中最重要的部分不一定位于公司名称的开头。即“Proctor and Gamble Company”或“United States Federal Reserve”</li>
- 缩写在公司名称中很常见,例如 HP、GM、GE、P&G、D&B 等。
- 一些公司故意将其名称拼写错误,作为其品牌的一部分,并将自己与其他公司区分开来。
匹配精确数据很容易,但匹配非精确数据可能会花费更多时间,我建议您应该考虑如何验证非精确匹配以确保这些匹配具有可接受的质量。
在我们建立 Match2Lists.com 之前,我们曾经花费大量时间来验证模糊匹配。在 Match2Lists 中,我们集成了一个强大的可视化工具,使我们能够查看非精确匹配,这在匹配验证方面被证明是一个真正的游戏规则改变者,降低了我们的成本并使我们能够更快地交付结果。
祝你好运!!