8

借助包/驱动程序(https://github.com/nicolewhite/Rneo4j) ,Neo4j可以使用流行的图形数据库。RRNeo4j

包作者@NicoleWhiteGitHub 上提供了几个 很好的使用示例

对我来说不幸的是,@NicoleWhite 和文档给出的示例有点过于简单化,因为它们手动创建了每个图形节点及其关联的labelsand properties,例如:

mugshots = createNode(graph, "Bar", name = "Mugshots", location = "Downtown")
parlor = createNode(graph, "Bar", name = "The Parlor", location = "Hyde Park")
nicole = createNode(graph, name = "Nicole", status = "Student")
addLabel(nicole, "Person")

当您处理一个很小的示例数据集时,这一切都很好,但是这种方法对于具有数千个用户的大型社交图是不可行的,其中每个用户都是一个节点(这样的图可能不会利用每个查询,但它们仍然需要输入Neo4j)。

我试图弄清楚如何使用向量或数据框来做到这一点。是否有解决方案,可能涉及apply语句或for循环?

这个基本的尝试:

for (i in 1:length(df$user_id)){
paste(df$user_id[i]) = createNode(graph, "user", name = df$name[i], email = df$email[i])
}

导致Error: 400 Bad Request

4

1 回答 1

12

作为第一次尝试,您应该查看我刚刚为事务端点添加的功能:

http://nicolewhite.github.io/RNeo4j/docs/transactions.html

library(RNeo4j)

graph = startGraph("http://localhost:7474/db/data/")
clear(graph)

data = data.frame(Origin = c("SFO", "AUS", "MCI"),
                  FlightNum = c(1, 2, 3),
                  Destination = c("PDX", "MCI", "LGA"))


query = "
MERGE (origin:Airport {name:{origin_name}})
MERGE (destination:Airport {name:{dest_name}})
CREATE (origin)<-[:ORIGIN]-(:Flight {number:{flight_num}})-[:DESTINATION]->(destination)
"

t = newTransaction(graph)

for (i in 1:nrow(data)) {
  origin_name = data[i, ]$Origin
  dest_name = data[i, ]$Dest
  flight_num = data[i, ]$FlightNum

  appendCypher(t, 
               query, 
               origin_name = origin_name, 
               dest_name = dest_name, 
               flight_num = flight_num)
}

commit(t)

cypher(graph, "MATCH (o:Airport)<-[:ORIGIN]-(f:Flight)-[:DESTINATION]->(d:Airport)
               RETURN o.name, f.number, d.name")

在这里,我形成了一个 Cypher 查询,然后遍历一个数据框并将值作为参数传递给 Cypher 查询。您现在的尝试会很慢,因为您正在为每个创建的节点发送单独的 HTTP 请求。通过使用事务端点,您可以在单个事务下创建多个事物。如果您的数据框非常大,我会将其拆分为每个事务大约 1000 行。

作为第二次尝试,您应该考虑在 neo4j-shell 中使用 LOAD CSV。

于 2014-08-13T21:31:38.233 回答