我需要编写一个接口,将包中的单个项目折叠成一个字符串。示例:{(a),(b)} 转换为 ab。
首先,可以使用代数接口返回字符串还是仅限于整数(Long)。
其次,是否有一个地方可以让我访问一些使用代数的示例(除了我随处可见的 COUNT 示例)。
只要回答是否可以使用代数来处理字符串,并让我知道是否有一个好地方可以让我看到一些现有的 UDF 代码(不是那些完全解决我的问题的代码)。
这些是我尝试过的事情:
- 谷歌搜索任何适用于包的 UDF 代码。除了随处发布的 COUNT 示例之外,没有得到任何东西
- 在 Pig 中尝试不同的选项。显然你不能取消引用一个包里的个别物品,这很糟糕。