graph - Titan 需要多大的 Faunus 图形分析框架？

Question

我正在研究在 TitanGraph 数据库上对两个数据集的边缘执行图形聚合（groupBy，groupCount）查询：

约 10,000 个节点和约 100 万条边
约 200,000 个节点和约 10 亿条边

有谁知道我需要在什么时候努力安装 Faunus 才能在 1 分钟内完成这种类型的 gremlin 查询？

score 5 · Accepted Answer

在 10000 个节点和 1M 条边上，普通 Gremlin（没有 Faunus）应该不会有问题。请参阅下面的代码，其中我使用 Furnace 生成了大约该大小的图形：

gremlin>  g = TitanFactory.open('/tmp/titan/generated')
==>titangraph[local:/tmp/titan/generated]
gremlin> import com.tinkerpop.furnace.generators.*
==>import com.tinkerpop.gremlin.*
==>import com.tinkerpop.gremlin.java.*
...
==>import com.tinkerpop.furnace.generators.*
gremlin> for (int i=0;i<10000;i++) g.addVertex(i)
==>null
gremlin> r = new java.util.Random()
==>java.util.Random@137f0ced
gremlin> generator = new DistributionGenerator("knows", { it.setProperty("weight", r.nextInt(100)) } as EdgeAnnotator)
==>com.tinkerpop.furnace.generators.DistributionGenerator@111a3ce4
gremlin> generator.setOutDistribution(new PowerLawDistribution(2.1))
==>null
gremlin> generator.generate(g,1000000)
==>1042671

回顾您在聚合上的帖子，我基本上对这个数据集执行了相同的查询。

gremlin> start=System.currentTimeMillis();g.E.groupBy{it.getProperty("weight")}{it}.cap.next();System.currentTimeMillis()-start
==>1415
gremlin> m.size()
==>100

如您所见，执行此遍历大约需要 1.5 秒（在 TinkerGraph 上大约需要 500 毫秒，它全部在内存中）。

在 1B 边缘，您可能需要 Faunus。我不认为你会在一分钟内完成所有这些边缘的迭代，即使你能以某种方式将它们全部放入内存中。请注意，使用 Faunus，您可能无法获得 1 分钟的查询/回答时间。我认为你需要进行一些实验。

graph - Titan 需要多大的 Faunus 图形分析框架？

1 回答 1

Related

Reference