Spark 的 Graphx 中的 mapTriplets 操作可以将三元组转换为其他形式,如定义所述:
def mapTriplets[ED2](map: EdgeTriplet[VD, ED] => ED2): Graph[VD, ED2]
我的数据是一个稀疏的二分图,每次迭代都会更新一条边的顶点数据。例如,这里是一条边,和(srcAttr, dstAttr, attr)
的顶点将根据 进行修改。因此,我需要的是获取所有组合,并用于更新.srcAttr
dstAttr
attr
(srcAttr, dstAttr, attr)
attr
vertices
Graphx 提供了mapTriplets
可以转换所有 (srcAttr, dstAttr, attr) 组合的方法,但是我不知道在执行此方法时如何修改顶点。
那么,有没有什么策略可以在遍历所有边的时候修改顶点呢?