我已经开始使用 Google 的 Dataprep 解决方案来清理电子商务产品提要。当我从 100 家电子商务商店接收数据时,我想清理数据以保持一致性并重命名品牌名称的各种拼写。例如,我有一列“供应商”,其中有数百万行阿迪达斯拼写不同:
阿迪达斯阿迪达斯阿迪达斯
经典阿迪达斯原件
阿迪达斯
原件
阿迪达斯滑板
阿迪达斯滑板
出于我的要求,我想将所有示例重命名为“adidas”。我正在查看 Dataprep 中的各种例程,并且 Replace 函数可以完成这项工作,但是,它不是一个可扩展的解决方案。
Dataprep 中有没有办法拥有品牌名称的主文件并查找此数据并替换不正确的实例?在 Excel 中,一个简单的 VLOOKUP 可能会起作用,我怀疑这是否存在于 Dataprep 中。
我希望以上内容有意义,谢谢那些可以提供帮助的人。
克雷格