node.js - Titan - Cassandra 和推送通知

Question

我计划将 Titan 与 Fanus 一起用于图形数据模型。

数据存储的选择 - 尽管 Cassandra 似乎是显而易见的选择，但我尚未决定数据存储。有没有人用其他数据存储对 Titan 进行基准测试？推送通知：需要将遍历响应推送到客户端。关于 Node.JS（基于事件）或 Vaadin（基于对象）的任何案例研究？谢谢！

score 2 · Accepted Answer

我为一家中型 P&C 保险公司尝试了 Titan，认为 Cassandra 是 3-4 百万份保险单的最佳选择（因为这听起来很大）。我惊讶地发现 Berkeley 和 PersistIt 更合适。

关键要点：每个后端都有优势，您需要根据数据集的特征权衡这些优势。这是一个简短的摘要：

BerkeleyDB 和 PersistIt

具有 10-1 亿个顶点的图的实际限制。但是，对于这种大小的图，两个存储后端都表现出高性能，因为所有数据都可以在同一个 JVM 中本地访问。

低延迟优化替代方案，在以读取为主、统一访问图表的工作负载方面表现出色。请注意，Hazelcast 不提供持久的持久性。此后端的理想图表可以完全适合一台或多台机器上的内存。此外，为了使这个存储后端具有成本效益，应该定期访问大部分图表。

当然，这些后端是针对大型图（数十亿到数千亿个顶点）的。请注意，在中小型图上，它们通常会被 Berkeley 或 PersistIt 超越。两者之间的选择归结为在一致分区系统 (HBase) 和可用分区系统 (Cassandra) 之间进行选择。

您也可以根据半过时的 CAP 定理来考虑这一点：