Cassandra 中的二级索引在中低基数字段上效果最好,即使在某些情况下也是如此。它们并非旨在让您以多种不同方式查询表(列族)。解决这个问题的最好方法是为此查询建模一个特定的表。如果我们遵循这些实体的层次结构(艺术家写专辑,专辑有标题),那么使用复合主键创建一个新表是最有意义的:
CREATE TABLE playlists_by_artist_album_title (
id uuid,
song_order bigint,
album text,
artist text,
song_id uuid,
title text,
PRIMARY KEY (artist, album, title));
这将按艺术家(分区键)键入所有条目,还允许您使用专辑和标题缩小结果。请注意,使用复合主键,您可以按从左到右的顺序按一个或多个主键字段进行查询。请注意,这种方法也不按歌曲顺序排序。
另一种解决方法是,如果您确定您将始终按艺术家、专辑和标题进行查询。如果是这种情况,那么您可以将它们全部定义为复合分区键的一部分,如下所示:
PRIMARY KEY ((artist, album, title), song_order);
虽然这需要所有查询中都存在艺术家、专辑和标题,但这将是查询此数据的最快方式。而 song_order 是一个聚类列,因此专辑中歌曲的顺序将被保留。但同样,这一切都取决于它将提供的查询。