1

我有一个用于社交网络分析的简单 neo4j 数据库。数据库由用户节点和用户可能共有的其他节点组成,例如电话或地址。只有一种类型的关系 [:HAS]。对于一个用户来匹配另一个用户,他们必须至少遍历一个节点。

我们的目标是将这些数据存储在图表中,并部署一个 R Shiny 应用程序以输入用户 ID 并查看连接用户的完整网络。为了做到这一点,我们需要将所有节点和关系从连接的子图中拉到边数据框中。

我们使用以下密码查询取得了一些成功。但是,此查询只会拉入距离不超过 5 度的节点。对于任何高度连接的节点,它也会失败 - 在此过程中冻结我们的 neo4j 实例。我们应该使用更有效的方法将图形数据转换为边数据框吗?

edges_query=paste('MATCH (c0:user {userID:',as.character(cust_id),'})-[]->(l1) 
               OPTIONAL MATCH (l1)<-[]-(c1)
               where id(c1) <> id(c0)
               OPTIONAL MATCH (c1)-[]->(l2)
               where id(l2) <> id(l1)
               OPTIONAL MATCH (l2)<-[]-(c2)
               where id(c2) <> id(c0)
               OPTIONAL MATCH (c2)-[]->(l3)
               where id(l3) <> id(l2)
               OPTIONAL MATCH (l3)<-[]-(c3)
               where id(c3) <> id(c2)
               OPTIONAL MATCH (c3)-[]->(l4)
               where id(l4) <> id(l3)
               OPTIONAL MATCH (l4)<-[]-(c4)
               where id(c4) <> id(c3)
               OPTIONAL MATCH (c4)-[]->(l5)
               where id(l5) <> id(l4)
               OPTIONAL MATCH (l5)<-[]-(c5)
               where id(c5) <> id(c4)


               return 
               ID(c0) as c0_node_id
               , c0.userID as c0_user_id
               , ID(l1) as l1_node_id
               , LABELS(l1) as l1_node_type
               , ID(c1) as c1_node_id
               , c1.userID as c1_user_id
               , id(l2) as l2_node_id
               , labels(l2) as l2_node_type
               , ID(c2) as c2_node_id
               , c2.userID as c2_user_id
               , id(l3) as l3_node_id
               , labels(l3) as l3_node_type
               , ID(c3) as c3_node_id
               , c3.userID as c3_user_id
               , id(l4) as l4_node_id
               , labels(l4) as l4_node_type
               , ID(c4) as c4_node_id
               , c4.userID as c4_user_id
               , id(l5) as l5_node_id
               , labels(l5) as l5_node_type
               , ID(c5) as c5_node_id
               , c5.userID as c5_user_id
               ',sep='')
4

1 回答 1

2

您应该在 Cypher 中使用可变长度路径匹配语法。此语法为[:REL_TYPE*min..max],例如[:HAS*..5]默认min值为 1。

您还应该使用参数而不是构建字符串。而不是使用paste嵌入cust_id,在查询中使用命名参数并在运行函数时将其替换为它的值cypher,例如

cypher(graph, "MATCH (n:User {userID: {cust_id} }) RETURN n.userID", cust_id=12345)

让我向您展示一个示例,说明如何使用示例图执行此操作。

library(RNeo4j)
library(visNetwork)

vis = function(edges) {
  nodes = data.frame(id=unique(c(edges$from, edges$to)))
  nodes$label = nodes$id
  visNetwork(nodes, edges)
}

graph = startGraph("http://localhost:7474/db/data")

query = "
MATCH p = (:User {userID: {cust_id}})-[:HAS*..5]-(:User)
WITH [x IN nodes(p) WHERE x:User] AS users
UNWIND range(1, size(users) - 1) AS idx
WITH users[idx - 1] AS from, users[idx] AS to
RETURN DISTINCT from.userID AS from, to.userID AS to;
"

edges = cypher(graph, query, cust_id="Tom Cruise")
vis(edges)

我编辑了 Neo4j 附带的电影图表以适合您的模型。上面的代码在 RStudio 中为我提供了以下内容:

可见网络

然后,您可以轻松地在带有renderVisNetwork.

于 2016-05-09T18:04:16.047 回答