1

情况:

我根据一些高音扬声器数据在 Spark(在 scala 中)构建了一个图表,如下所示:

  • 每个顶点都有一个推文 ID(长)和推文的正文(字符串)
  • 每条边都将源推文连接到转推

我这样做的方法是从边缘文件创建一个图形:

val followerGraph = GraphLoader.edgeListFile(sc, "C:\\Users\\...\\tweetGraphEdgesData.txt")

然后使用 outerJoinVertices 将属性添加到每个顶点

   val graph = followerGraph.outerJoinVertices(verticesData){
    case(uid,deg,Some(attrList))=>attrList
    case(uid,deg,None)=> Array.empty[String]
   }

问题:

现在我想将它连接到的边数附加到每个顶点(这基本上意味着它被转发了多少次)。我怎样才能做到这一点?

4

1 回答 1

0

只需将顶点与传出边的数量连接起来

graph.vertices.leftOuterJoin(graph.outDegrees)
于 2015-09-09T13:05:43.147 回答