0

我有一个包含 200 个节点的 Neo4j 4.1 数据库(仅用于演示目的)。节点可以按 5 个不同的组或 50 个进行分组。当我使用 5 个标签时,几乎均匀分布在 200 个节点上,Neo4j Bloom 运行平稳。当我使用 50 个标签时,大部分都是均匀分布的,Bloom 的速度急剧下降。例如,在 Bloom 的搜索字段中提取标签模式需要将近 100 倍的时间。

在这两种情况下,每个节点都只有一个标签集。在这两种情况下都没有设置索引。

我很好奇数据库中使用的标签数量(总共不在一个节点上 - 这个问题已经得到解答)是否会产生这些戏剧性的影响?如前所述,它只是一个演示数据库,只有 200 个节点和 1500 个关系,每个节点都有一个标签。唯一的区别是数据库中的标签总数。这个数量不应如此显着地限制 Bloom 中的查询时间。

在标准开发硬件上本地安装。没有对内存、堆等进行自定义……所有标准都是开箱即用的。

任何可以解释这种性能差异的想法都受到高度赞赏。

4

0 回答 0