0

Pentaho Spoon 中的值映射器转换是否有通配符?我做了一些挖掘,只找到了上传文件和文档的通配符解决方案。我需要能够映射包含特定单词的任何和所有潜在值,但我没有办法识别包含该单词的短语的所有可能变体。

示例:将网站值映射到类别。

值 -> 映射类别

facebook.com -> 脸书

m.facebook.com -> 脸书

google.com -> 谷歌

google.ca -> 谷歌

我更喜欢使用通配符(例如,我们称之为 %),以便一个映射在我的值映射器中捕获给定类别(例如 %facebook% -> Facebook)的所有案例。另一个好处是通配符可以正确映射任何未来的站点流量值。(例如,假设的 l.facebook.com 将被正确映射,如果它曾经输入我的数据)

我尝试了各种字符作为通配符,但都没有奏效。+ \ * %

谢谢,麻烦您了!

4

1 回答 1

1

您可以使用使用正则表达式替换字符串中的步骤来执行此操作。

如果您仍需要原始字段,请先使用计算器步骤创建一个副本。然后,您可以将多个映射放入替换步骤。它们将按顺序运行,如果正则表达式匹配,则将字段的内容替换为您选择的映射。

性能可能不是很好,但它为您提供了正则表达式的全部灵活性。请记住,这种方式可以为您提供第一场比赛。请参阅我的示例以了解可能出现的问题。

在此处输入图像描述

于 2017-04-21T14:39:41.423 回答