当然,您只能通过......实际实现它来了解您的系统性能以及您的用例负载!除此之外,在着手制作原型之前,我正在寻找一些关于 Cassandra 性能的粗略估计。
对于节点和数据中心的各种配置,以及各种读写一致性级别,读取过时值的机会有多大?你希望每秒维持什么样的关键读写,每次读写会有什么样的延迟?
当然,您只能通过......实际实现它来了解您的系统性能以及您的用例负载!除此之外,在着手制作原型之前,我正在寻找一些关于 Cassandra 性能的粗略估计。
对于节点和数据中心的各种配置,以及各种读写一致性级别,读取过时值的机会有多大?你希望每秒维持什么样的关键读写,每次读写会有什么样的延迟?
今年早些时候在 VLDB 上展示的 Cassandra 基准测试:http: //vldb.org/pvldb/vol5/p1724_tilmannrabl_vldb2012.pdf
性能/一致性权衡:http ://www.datastax.com/dev/blog/your-ideal-performance-consistency-tradeoff
我们运行一个应用程序,每个 Web 节点每秒发布 500 个数据点(我们有 6 个 cassandra 节点)。如果我们在客户端缓存 100M 的数据以避免读取,我们可能会在每个节点每秒获得 1000 个数据点。
其配置文件是在每个请求上使用带有一个 findAll(List keys) 和一个 putAll(Listentities) 的 PlayOrm,其中该列表中的每个键都是单个数据点,因为客户端通过 http 发送一批数据点,所以我们不有尽可能多的 http 开销....也许这至少会给你一些想法,但不确定。
我们尚未测试 Web 节点与 cassandra 节点的正确比例,但我怀疑它就像我的最后一个客户端一样,在这个项目中它几乎是一对一的,尽管它会随着配置文件而变化。
我们现在运行 4 个 Web 节点并每秒获得 2000 个数据点。