2

当我使用 spark 时,我无法保存我的优势,如下所示:有关信息,它可以通过使用 gremlin 控制台来保存优势

val graph = DseGraphFrameBuilder.dseGraph("GRAPH_NAME", spark)
graph.V().has("vertex1","field1","value").as("a").V().has("vertex2","field1","value").addE("myEdgeLabel").to("a")

当我尝试时:graph.edges.show() 我得到一张空桌子

4

1 回答 1

1

addE() 步骤尚未在 DseGraphFrames 中实现,您应该使用 DGF 特定的 updateEdges() 函数。该功能是为批量更新而设计的 它采用带有 DGF 格式新边的 spark 数据帧:

scala> newEdges.printSchema
root
 |-- src: string (nullable = false)
 |-- dst: string (nullable = false)
 |-- ~label: string (nullable = true)

src 和 dst 列是编码的顶点 ID。您可以使用 g.idColumn() 辅助函数构建它们或从顶点中选择它们。通常你知道 ids 并使用辅助函数

scala>  val df = Seq((1, 2, "myEdgeLabel")).toDF("v1_id", "v2_id", "~label")
scala> val newEdges=df.select(g.idColumn("vertex2", $"v2_id") as "src", g.idColumn("vertex1", $"v1_id") as "dst", $"~label")
scala> g.updateEdges(newEdges)

对于您的特定情况,您可以先查询 id,然后根据它们插入。永远不要在生产中这样做,这种方法很慢而且不是散装的。在巨大的图表上使用方法#1:

val dst = g.V.has("vertex1","field1","value").id.first.getString(0)
val src = g.V.has("vertex2","field1","value").id.first.getString(0)
val newEdges = Seq((src, dst, "myEdgeLabel")).toDF("src", "dst", "~label")
g.updateEdges(newEdges)

请参阅文档:https ://docs.datastax.com/en/dse/5.1/dse-dev/datastax_enterprise/graph/graphAnalytics/dseGraphFrameImport.html

于 2019-02-01T07:20:09.423 回答