选择分布比率:每个分区应插入的行数占分区总可能行的比例(由集群分布列定义)。默认 FIXED(1)/1
有人可以解释这是什么意思吗?为什么在插入分配时将其称为选择分配配给?
http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema
选择分布比率:每个分区应插入的行数占分区总可能行的比例(由集群分布列定义)。默认 FIXED(1)/1
有人可以解释这是什么意思吗?为什么在插入分配时将其称为选择分配配给?
http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema
在 cassandra 中,数据通过分区键分配给给定节点,然后根据分区内的集群键排序存储在磁盘上。
“分配比率”允许您定义:
1)压力工具将在每个分区中创建多少行,
2)压力工具将从每个分区读取多少行(它们将被排序,因此抓取多个行相当快)
在 FIXED() 的情况下,这意味着每个分区将具有 FIXED 行数 - 如果您选择其他一些选项,您最终会得到可变数量的行数。
编辑以解释每个分区的多行:
例如,如果您有一个从不同城市收集天气信息的数据模型:
CREATE TABLE sensor_readings (
station_id text,
weather_time timestamp,
temperature int,
humidity int,
PRIMARY KEY(station_id, weather_time));
在这种情况下,每个分区 (station_id) 中有多行(每个 weather_time 一个)。您可以查询给定 station_id 中的所有传感器读数,也可以仅查询一个特定的 weather_time。分配比率控制weather_time
您每个 s 的数量station_id
。