我一直在寻找 Cassandra、HBase、Mongodb 和 Elastic Search 的写入性能的真实测试结果。我想从我们的服务器收集日志数据,这些数据非常庞大。超过 10gb 一个小时。
我知道每个人都在谈论 cassandra 的写入性能,并且这些产品有不同的使用领域。K/V,面向文档或搜索。但我现在感兴趣的不是他们的存储类型,而是写入性能。例如每秒 50K 事务。
我也想在这些数据之上进行搜索。
对于每秒处理超过 50K 的传输,您有什么建议。
我一直在寻找 Cassandra、HBase、Mongodb 和 Elastic Search 的写入性能的真实测试结果。我想从我们的服务器收集日志数据,这些数据非常庞大。超过 10gb 一个小时。
我知道每个人都在谈论 cassandra 的写入性能,并且这些产品有不同的使用领域。K/V,面向文档或搜索。但我现在感兴趣的不是他们的存储类型,而是写入性能。例如每秒 50K 事务。
我也想在这些数据之上进行搜索。
对于每秒处理超过 50K 的传输,您有什么建议。
Cassandra 确实很快。
伏地魔也很快。我知道至少有一个大型网站选择它而不是所有其他选项。
但是,实际上,50K/秒并没有什么特别之处。我在一台机器上用 MySQL 做的。
但是请注意,除了写入数据的速度之外,您还应该对以后可以使用该数据做什么感兴趣。否则,您可以将所有写入通过管道传输到 /dev/null。它会非常快。
此外,您在互联网上找到的任何“基准”都是无用的。它要么使用具有某些特征的数据,要么使用合成数据。这可以使一切变得不同。除了您之外,没有人会使用您的数据对您的场景进行基准测试。
您可能对 Netflix 在 EC2 上每秒高达一百万次写入的 Cassandra 基准测试感兴趣:http: //techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html