所以我的输入数据有两个字段/列:id1 & id2,我的代码如下:
TextLine(args("input"))
.read
.mapTo('line->('id1,'id2)) {line: String =>
val fields = line.split("\t")
(fields(0),fields(1))
}
.groupBy('id2){.size}
.write(Tsv(args("output")))
输出结果(我假设)两个字段:id2 * size。我有点想知道是否可以保留也与 id2 分组的 id1 值并将其添加为另一个字段?