我是 neo4j 的新手。我需要从这 2000 万个数据集中提取前 500 万个或任何 500 万个数据范围内的关系。我一直在努力对我的数据运行范围查询。如果我可以提取数据并再次导入 neo4j,那对我来说将是非常幸运的。
这些是我的节点的属性 - 地址、哈希、时间、通知、public_key(所有节点不包含相同的属性,一些包含地址、一些哈希、时间等)
只是让你知道。如果我开始 n=node(*) 返回 n; 然后看起来我的电脑进入了永无止境的睡眠状态。
任何帮助将不胜感激。
我是 neo4j 的新手。我需要从这 2000 万个数据集中提取前 500 万个或任何 500 万个数据范围内的关系。我一直在努力对我的数据运行范围查询。如果我可以提取数据并再次导入 neo4j,那对我来说将是非常幸运的。
这些是我的节点的属性 - 地址、哈希、时间、通知、public_key(所有节点不包含相同的属性,一些包含地址、一些哈希、时间等)
只是让你知道。如果我开始 n=node(*) 返回 n; 然后看起来我的电脑进入了永无止境的睡眠状态。
任何帮助将不胜感激。
所以你希望它返回任意 500 万个节点?这将是大量的数据。您的计算机在您运行时一直运行的原因start n=node(*) return n;
是因为系统通常会尝试缓存所有内容,或者尝试返回所有数据,系统无法解析和返回。我不相信有一种 Cypher 方法可以返回节点 1-1,000,000,而不必在START
子句中将它们全部以逗号分隔。
您需要使用 Cypher 吗?如果您可以为此使用本机 Java API,那就太好了,因为您可以在每个节点上执行您的处理,而不是在查询之外不需要它们时返回它们。
一个答案可能如下: START n=node(*) RETURN n ORDER BY n.property LIMIT 1