我有一个People
表(Id, first_name, last_name)
,主键在哪里id
。我希望能够查找按顺序排列的表中的前 N 个人(last_name, first_name, Id)
。在某些情况下,我需要查找接下来的 N 个人,依此类推。我想有效地做到这一点。做这个的最好方式是什么?
1 回答
主要有两种方式:
- 使用
LIMIT
和OFFSET
LIMIT
上一页的使用和键
OFFSET 策略允许您读取任意页面,但效率不高,因为每次运行查询时都必须读取所有先前页面的行。它是最容易实现的,并且是一种可接受的策略(特别是如果您只想要前几页),但一般不建议这样做。key-of-previous-page 策略确实要求按顺序读取页面,但效率更高,因为每个页面只读取它需要的行。
因此,让我们从原始查询开始,从按以下顺序排列的表中获取结果(LastName, FirstName, Id)
:
SELECT
t.id,
t.first_name,
t.last_name
FROM
People as t
ORDER BY
t.last_name,
t.first_name,
t.id
LIMIT
@limit_rows
您可能希望确保所有查询都查看数据库数据的一致快照,因此您需要确保查询序列始终从相同的时间戳读取。完成此操作的最简单方法是将您的第一个查询returnReadTimestamp
设置为设置为 true 的 ReadOnly 事务。然后,您的后续查询也可以是只读事务,它们应该使用原始查询返回的时间戳作为它们的 readTimestamp。请注意,无论您选择何种方法,该ORDER BY
子句对于确保在您的查询序列中获得一致的结果至关重要。假设返回的最后一行是(1709, "John", "Smith")
. 然后,您第一次尝试查询以获取下一页结果可能如下所示:
SELECT
t.id,
t.first_name,
t.last_name
FROM
People as t
WHERE
t.last_name > "Smith"
OR
(t.last_name = "Smith" and t.first_name > "John")
OR
(t.last_name = "Smith" and t.first_name = "John" AND t.id > 1709)
ORDER BY
t.last_name,
t.first_name,
t.id
LIMIT
@limit_rows
中间WHERE
从句是新的。但是写这个谓词比你想象的要复杂。您可能必须处理 NULL 值。您必须处理多个名为 John Smith 且具有不同id
值的人的情况。而且您需要非常小心浮点数和NaN
值。Cloud Spanner 的读取 API 在这种情况下也很有用,因为它可以更轻松地对表上的范围扫描进行分页。