我计划将 Titan 与 Fanus 一起用于图形数据模型。
数据存储的选择 - 尽管 Cassandra 似乎是显而易见的选择,但我尚未决定数据存储。有没有人用其他数据存储对 Titan 进行基准测试?推送通知:需要将遍历响应推送到客户端。关于 Node.JS(基于事件)或 Vaadin(基于对象)的任何案例研究?谢谢!
我计划将 Titan 与 Fanus 一起用于图形数据模型。
数据存储的选择 - 尽管 Cassandra 似乎是显而易见的选择,但我尚未决定数据存储。有没有人用其他数据存储对 Titan 进行基准测试?推送通知:需要将遍历响应推送到客户端。关于 Node.JS(基于事件)或 Vaadin(基于对象)的任何案例研究?谢谢!
我为一家中型 P&C 保险公司尝试了 Titan,认为 Cassandra 是 3-4 百万份保险单的最佳选择(因为这听起来很大)。我惊讶地发现 Berkeley 和 PersistIt 更合适。
关键要点:每个后端都有优势,您需要根据数据集的特征权衡这些优势。这是一个简短的摘要:
具有 10-1 亿个顶点的图的实际限制。但是,对于这种大小的图,两个存储后端都表现出高性能,因为所有数据都可以在同一个 JVM 中本地访问。
低延迟优化替代方案,在以读取为主、统一访问图表的工作负载方面表现出色。请注意,Hazelcast 不提供持久的持久性。此后端的理想图表可以完全适合一台或多台机器上的内存。此外,为了使这个存储后端具有成本效益,应该定期访问大部分图表。
当然,这些后端是针对大型图(数十亿到数千亿个顶点)的。请注意,在中小型图上,它们通常会被 Berkeley 或 PersistIt 超越。两者之间的选择归结为在一致分区系统 (HBase) 和可用分区系统 (Cassandra) 之间进行选择。
您也可以根据半过时的 CAP 定理来考虑这一点:
https://github.com/thinkaurelius/titan/wiki/images/titan-captheorem.png