2

有人可以解释如何阅读这些图表吗?我了解从头到尾的流程,但我特别想知道如何读取椭圆(管道/水龙头)之间的字段(括号)转换。

例如,使用图像中每个管道之后的字段,我能够解释这些的方式是第一个字段集,即 [{2}:'token', 'count'] 是进入下一个管道的内容/点击,但是第二个字段集[{1}:'token']的意义是什么?

这是进入上一个管道的字段集吗?第二个括号是否具有编程意义,即我们是否能够使用特定的级联代码在该管道中访问它?(在第二个字段集大于第一个的情况下)

不耐烦的厕所 PNG
(来源:cascading.org

4

1 回答 1

2

第二个字段集表示哪些字段可用于该 map 或 reduce 中的后续操作。

在您上面的示例中,在减少步骤中,由于您按“令牌”分组,因此只有“令牌”可用于该减少步骤中的后续聚合(Everys)。例如,您可以添加另一个输出平均令牌长度的聚合,但您还不能使用使用“计数”的聚合。

这种行为的原因是同一组上的后续聚合并行发生。因此, Count 不会完成以馈入您链接的任何其他聚合。

于 2013-04-04T19:25:11.173 回答