neo4j - 在不知道节点 ID 的情况下在 Neo4j 中导入大数据

Question

我有一个问题，女巫是在 neo4j db 中插入一些数据的最佳方式。我有一个包含很多电影信息的文件，每部电影都有不同的 ID，例如“tt0202025”。我还有一个包含演员信息的文件，每个文件都有一个像“mm2183122”这样的 ID 我还有另一个文件，女巫描述了演员参与的电影。mm2183122|tt0202025,tt0204548

我已经为 csv 找到了一些东西，比如插入，但由于数据大小，我之前无法在节点之间创建关系文件。

我必须先添加电影节点和演员节点，然后再添加它们之间的关系吗？以及如何知道为每个节点创建了哪个节点 ID 以创建关系？数据很大。

我也阅读了批量插入，但我无法准确理解它是如何工作的，所以我可以用 Java 编写我的代码。

希望有人可以指导我！

提前致谢！

score 2 · Accepted Answer

正如您所指出的，最简单的解决方案是插入电影节点和演员节点，然后创建关系。

您可以使用“mm2183122”和“tt0202025”作为节点上的属性来跟踪节点：例如，您的节点上有一个“file_id”属性，您可以在创建节点时对其进行索引，并在您想要创建时查询它关系。如果您多次插入节点，我会使用唯一索引来确保不会复制节点。对于 REST API，您可以在此处查看文档：http: //docs.neo4j.org/chunked/milestone/rest-api-unique-indexes.html

Cypher 还允许您创建唯一节点。

score 0 · Accepted Answer

您可以查看 Talend Open Studio for Big Data - 它有一个 Neo4j 连接器。学习曲线相当陡峭但值得。

neo4j - 在不知道节点 ID 的情况下在 Neo4j 中导入大数据

2 回答 2

Related

Reference