java - 使用 Cassandra 中的 hector 客户端使用复合键的第一个组件获取行

Question

我在rowkey中使用复合数据类型，列族如下

create column family CompositeTest
with comparator = 'UTF8Type'
and key_validation_class = 'CompositeType(UTF8Type,UTF8Type)'
and default_validation_class = 'UTF8Type';

该列族的样本数据如下，

RowKey: s2:2222222
=> (column=param1, value=value1
=> (column=param2, value=value2
=> (column=param3, value=value3
-------------------
RowKey: s2:3333333
=> (column=param1, value=value1
=> (column=param2, value=value2
=> (column=param3, value=value3
-------------------
RowKey: s2:1111111
=> (column=param1, value=value1
=> (column=param2, value=value2
=> (column=param3, value=value3
-------------------
RowKey: s1:3333333
=> (column=param1, value=value1
=> (column=param2, value=value2
=> (column=param3, value=value3
-------------------
RowKey: s1:2222222
=> (column=param1, value=value1
=> (column=param2, value=value2
=> (column=param3, value=value3
-------------------
RowKey: s1:1111111
=> (column=param1, value=value1
=> (column=param2, value=value2
=> (column=param3, value=value3

我想获取行键的第一个组件是“s1”的所有行。是否可以使用 Hector 客户端？如果不是，那么可能由哪个 cassandra 客户端？

我已经尝试使用以下代码，但它不起作用，

Composite start = new Composite();
        start.addComponent(0, "s1", ComponentEquality.EQUAL);

        Composite end = new Composite();
        end.addComponent(0, "s1", ComponentEquality.GREATER_THAN_EQUAL);

        RangeSlicesQuery<Composite, String, String> rangeSlicesQuery = HFactory.createRangeSlicesQuery(keyspace, new CompositeSerializer(), StringSerializer.get(),  StringSerializer.get()); 
        rangeSlicesQuery.setKeys(start, end);
        rangeSlicesQuery.setRange("param1", "param3", false, 100);
        rangeSlicesQuery.setColumnFamily("CompositeTest");
        rangeSlicesQuery.setRowCount(11);
        QueryResult<OrderedRows<Composite, String, String>>  queryResult = rangeSlicesQuery.execute();

        Rows<Composite, String, String> rows = queryResult.get();
        Iterator<Row<Composite, String, String>> rowsIterator = rows.iterator();

提前致谢...

score 2 · Accepted Answer

这在 Cassandra 中使用任何客户端都是不可能的。虽然行键对您（应用程序开发人员）显示为复合对象，但在 Cassandra 本身中，行键是单个字节数组，它作为单个原子值存储在 Cassandra 的 SSTable 中。

这意味着，您只能使用整个 key查询一行，而不仅仅是 key 的一部分。否则，您必须扫描整个列族，直到找到匹配项——这将非常昂贵。

话虽如此，如果您确实需要能够仅使用行键的一部分来查询列族中的行，那么我强烈建议为这些键部分创建单独的索引列族。这将允许您使用标准键/列查找来查找原始数据列族中与您的条件匹配的所有行。

score 1 · Accepted Answer

问题是您正在尝试对行键执行切片。如果您在 Cassandra 中使用随机分区器（例如 RandomPartitioner 或 Murmur3Partitioner），则根本不可能。如果您使用的是顺序保留分区器，则可能（但我从未尝试过）。在您的情况下，应该是一个不存在不幸的 CompositeKeyPartitioner，因此您应该自己编写它。然后，您还应该通过根据您的数据计算正确的令牌来配置集群。如您所见，这不是最简单的方法。

但是，如果您只是将复合值放在列名而不是键中，您也可以这样做。你可以这样定义你的CF：

create column family CompositeTest
   with comparator = 'CompositeType(UTF8Type,UTF8Type)'
   and key_validation_class = 'UTF8Type'
   and default_validation_class = 'UTF8Type';

并将数据存储为：

RowKey: s2
=> (column=2222222:param1, value=value1
=> (column=2222222:param2, value=value2
=> (column=2222222:param3, value=value3
=> (column=3333333:param1, value=value1
=> (column=3333333:param2, value=value2
=> (column=3333333:param3, value=value3
=> (column=1111111:param1, value=value1
=> (column=1111111:param2, value=value2
=> (column=1111111:param3, value=value3
-------------------
RowKey: s1:
=> (column=3333333:param1, value=value1
=> (column=3333333:param2, value=value2
=> (column=3333333:param3, value=value3
=> (column=2222222:param1, value=value1
=> (column=2222222:param2, value=value2
=> (column=2222222:param3, value=value3
=> (column=1111111:param1, value=value1
=> (column=1111111:param2, value=value2
=> (column=1111111:param3, value=value3

使用这种结构，您认为查询非常简单，然后您始终可以对列名进行切片以仅选择所需区间内的那些列。

java - 使用 Cassandra 中的 hector 客户端使用复合键的第一个组件获取行

2 回答 2

Related

Reference