4

我想用 1、2、3 和 4 个实例对我的 Cassandra 集群进行基准测试。所以我在其中一个节点上运行了 cassandra-stress 工具。基准测试显示了奇怪的结果,请参见下图(--> 当线程数很少时,单节点集群比 2-/3-/4-节点集群具有更多的 ops/sek)。

我的结果(x 轴=线程,y 轴=ops/sek,数据集=集群中的节点(1、2、3、4):
在此处输入图像描述

此基准站点结果相比,我的结果似乎不正确。

我现在的问题是:如果我在集群的一台机器上运行以下命令,我是否正确使用了该工具:

cassandra-stress write

我也试过这个没有任何效果:

cassandra-stress write -node ip1,ip2,...

另请参阅我的其他问题。谢谢!

-- 编辑:Jim 的解决方案 --
从 C* 集群外的其他 EC2 实例运行 cassandra-tool,但在同一个 LAN 中(这样您就可以使用内部 ips 10.xxx)。我启动了一个 1/2/4 节点集群,其中包含 4 个独立的基准调用节点。他们每个人都有以下命令之一:

第一次写:

cassandra-stress write n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=1..1000000 -node ip1,ip2,ip3,ip4
cassandra-stress write n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=1000001..2000000  -node ip1,ip2,ip3,ip4
cassandra-stress write n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=2000001..3000000 -node ip1,ip2,ip3,ip4
cassandra-stress write n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=3000001..4000000 -node ip1,ip2,ip3,ip4

然后使用读取命令读取此数据:

cassandra-stress read n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=1..1000000 -node ip1,ip2,ip3,ip4
cassandra-stress read n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=1000001..2000000  -node ip1,ip2,ip3,ip4
cassandra-stress read n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=2000001..3000000 -node ip1,ip2,ip3,ip4
cassandra-stress read n=1000000 cl=one -mode native cql3 -schema keyspace="keyspace1" -pop seq=3000001..4000000 -node ip1,ip2,ip3,ip4

这里是阅读的结果

1 Node cluster: 149,000 ops/sec
2 Node cluster: 348,000 ops/sec
4 Node cluster: 480,000 ops/sec



谢谢你,吉姆!

4

1 回答 1

4

如果您只在一个节点上运行 cassandra-stress,那么我认为这将是预期的结果。单台机器无法使四节点集群饱和,这将成为瓶颈。

此外,如果您在其中一个 cassandra 节点上运行 cassandra-stress,则该节点将通过同时运行 Cassandra 和压力客户端来双重加载。这会给该机器的 CPU 和网络连接带来额外的压力。

要获得集群吞吐量的真实情况,您应该从集群外部的多台机器(但在同一个 LAN 上)运行压力。

于 2015-07-10T20:30:34.747 回答