3

感谢 Google 提供 BigQuery,太棒了!
BigQuery 是否可以进行近似字符串匹配/模糊字符串搜索?
Google 是否有计划将此功能添加到 BigQuery?

当然,Google 专有的近似字符串匹配算法可用于向 BigQuery 提供此功能,同时仍保留 Google 知识产权。我们搜索了所有 BigQuery 文档和 Stack Overflow 问题。当然有很多算法可以做到这一点,但如何与 BigQuery 集成?

我们的需求很简单,比较两个几乎相同但可能略有不同的字符串。例如:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC".  

从我们的 BigQuery 测试看来,两个字符串需要完全匹配,BigQuery 才能加入它们,甚至可以降低到每个字符串中尾随空格的数量。非常感谢添加此功能或与 BigQuery 集成的指南。这是为了支持 Milwaukee Jets,这是一家位于威斯康星州密尔沃基的区域性、创新性、部分喷气式飞机所有权公司。再次感谢 Google 提供 BigQuery。

非常感谢您和最诚挚的问候, Andrew Paullin (414) 212-5372

4

1 回答 1

5

不幸的是,不支持近似字符串匹配。最接近的方法是使用正则表达式。您最好的选择可能是在数据到达 BigQuery 之前对其进行规范化 - 即将“Rhodes USA”和“Rhodes, USA.”转换为相同的字符串。不过,我会为此支持添加一个功能请求错误。

于 2012-05-11T15:22:22.267 回答