1

选择分布比率:每个分区应插入的行数占分区总可能行的比例(由集群分布列定义)。默认 FIXED(1)/1

有人可以解释这是什么意思吗?为什么在插入分配时将其称为选择分配配给?

http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema

4

1 回答 1

3

在 cassandra 中,数据通过分区键分配给给定节点,然后根据分区内的集群键排序存储在磁盘上。

“分配比率”允许您定义:

1)压力工具将在每个分区中创建多少行,

2)压力工具将从每个分区读取多少行(它们将被排序,因此抓取多个行相当快)

在 FIXED() 的情况下,这意味着每个分区将具有 FIXED 行数 - 如果您选择其他一些选项,您最终会得到可变数量的行数。

编辑以解释每个分区的多行:

例如,如果您有一个从不同城市收集天气信息的数据模型:

CREATE TABLE sensor_readings (
station_id text,
weather_time timestamp,
temperature int,
humidity int,
PRIMARY KEY(station_id, weather_time)); 

在这种情况下,每个分区 (station_id) 中有多行(每个 weather_time 一个)。您可以查询给定 station_id 中的所有传感器读数,也可以仅查询一个特定的 weather_time。分配比率控制weather_time您每个 s 的数量station_id

于 2016-01-21T06:52:57.843 回答