0

我有一个问题,女巫是在 neo4j db 中插入一些数据的最佳方式。我有一个包含很多电影信息的文件,每部电影都有不同的 ID,例如“tt0202025”。我还有一个包含演员信息的文件,每个文件都有一个像“mm2183122”这样的 ID 我还有另一个文件,女巫描述了演员参与的电影。mm2183122|tt0202025,tt0204548

我已经为 csv 找到了一些东西,比如插入,但由于数据大小,我之前无法在节点之间创建关系文件。

我必须先添加电影节点和演员节点,然后再添加它们之间的关系吗?以及如何知道为每个节点创建了哪个节点 ID 以创建关系?数据很大。

我也阅读了批量插入,但我无法准确理解它是如何工作的,所以我可以用 Java 编写我的代码。

希望有人可以指导我!

提前致谢!

4

2 回答 2

2

正如您所指出的,最简单的解决方案是插入电影节点和演员节点,然后创建关系。

您可以使用“mm2183122”和“tt0202025”作为节点上的属性来跟踪节点:例如,您的节点上有一个“file_id”属性,您可以在创建节点时对其进行索引,并在您想要创建时查询它关系。如果您多次插入节点,我会使用唯一索引来确保不会复制节点。对于 REST API,您可以在此处查看文档:http: //docs.neo4j.org/chunked/milestone/rest-api-unique-indexes.html

Cypher 还允许您创建唯一节点。

于 2013-04-12T13:30:23.983 回答
0

您可以查看 Talend Open Studio for Big Data - 它有一个 Neo4j 连接器。学习曲线相当陡峭但值得。

于 2013-05-31T18:09:17.740 回答