嗨,我在 Cassandra 中有下表:
* ---------------------------------------------------------------------------
* Note:
* 'curr_pos' is always fixed, so we can put it into cluster key and order
* In each crawler iteration 'prev_pos', 'domain_*' are updated
* -------------------------------------------------------------------------
* Patterns:
* <domain_name3rd>.<domain_name2nd>.<domain_name1st>
* --------------------------------------------------------------------------
CREATE TABLE IF NOT EXISTS lp_registry.keyword_position (
engine text,
keyword text,
updated timestamp,
domain_name1st text,
domain_name2nd text,
domain_name3rd text,
prev_pos int,
curr_pos int,
PRIMARY KEY ((engine, keyword), curr_pos)
);
在顶级应用程序中,我有一个包含大约数百个关键字的列表。
我需要的?
对于固定引擎和关键字列表,我想选择所有域及其位置。
更新:应用程序给出的结果将是每个引擎的 NxM 矩阵,具有 N 个用户定义的关键字和 M 个用户定义的域。在每个单元格中将是特定关键字的域位置。
我对什么感到困惑?
我需要根据关键字列表的大小发布 N 个选择。换句话说,我需要遍历应用程序中的关键字,并在每次迭代中将选择发送到数据库。
我希望 N 不会大于 100,但我仍然认为这是太多的查询。
我的问题
我可以将这些选择打包成一个批次吗?如何?