如果我们将 Interleave 选项与二级索引一起使用,那么使用 storage 子句是否还有好处?
问问题
252 次
1 回答
1
是的,仍然会有好处,尽管它不太可能是主要好处:
假设您有交错表 Singers->Albums->Songs,并且您有一个索引:
CREATE INDEX SongsBySingerSongName ON Songs(SingerId, SongName),
INTERLEAVE IN Singers
我们还假设Songs
有一个FLOAT64
列,LengthInSeconds
,用于存储歌曲的长度。
如果您想查找SingerId
以“T”开头且长度小于 4 分钟的 123 首歌曲,您的查询可以通过以下方式执行:
- 用于查找以
SongsBySingerSongName
“T”开头的 Singer 123 的所有歌曲 - 对于这些歌曲,反向连接
Songs
以查找LengthInSeconds
以按长度过滤。
由于Songs
和SongsBySingerSongName
都在表中交错Singers
,我们知道我们的数据应该都在同一个split中,这意味着它们都将驻留在同一台机器上,这意味着步骤(2)中的反向连接不会非常昂贵. 但是,本地反向连接仍然会产生查找数据的成本,因此通过使用STORING
子句来节省步骤 (2) 仍然可以减少查询延迟和总体成本。您可能希望对工作负载进行基准测试,以查看额外存储条款是否提供了净收益。
一般来说,如果您的查询中有过滤器引用索引中的列(键列或“存储”列),则可以在对基表进行反向连接之前评估过滤器,如果过滤器没有匹配,可以避免反向连接。如果过滤器引用的列不在索引中,则必须先进行反向连接以获取过滤器引用的列值
于 2017-03-27T16:35:52.420 回答