3

我有一个People(Id, first_name, last_name),主键在哪里id。我希望能够查找按顺序排列的表中的前 N ​​个人(last_name, first_name, Id)。在某些情况下,我需要查找接下来的 N 个人,依此类推。我想有效地做到这一点。做这个的最好方式是什么?

4

1 回答 1

4

主要有两种方式:

  • 使用LIMITOFFSET
  • LIMIT上一页的使用和键

OFFSET 策略允许您读取任意页面,但效率不高,因为每次运行查询时都必须读取所有先前页面的行。它是最容易实现的,并且是一种可接受的策略(特别是如果您只想要前几页),但一般不建议这样做。key-of-previous-page 策略确实要求按顺序读取页面,但效率更高,因为每个页面只读取它需要的行。

因此,让我们从原始查询开始,从按以下顺序排列的表中获取结果(LastName, FirstName, Id)

SELECT
  t.id, 
  t.first_name, 
  t.last_name
FROM
  People as t
ORDER BY
  t.last_name,
  t.first_name,
  t.id
LIMIT
  @limit_rows

您可能希望确保所有查询都查看数据库数据的一致快照,因此您需要确保查询序列始终从相同的时间戳读取。完成此操作的最简单方法是将您的第一个查询returnReadTimestamp设置为设置为 true 的 ReadOnly 事务。然后,您的后续查询也可以是只读事务,它们应该使用原始查询返回的时间戳作为它们的 readTimestamp。请注意,无论您选择何种方法,该ORDER BY子句对于确保在您的查询序列中获得一致的结果至关重要。假设返回的最后一行是(1709, "John", "Smith"). 然后,您第一次尝试查询以获取下一页结果可能如下所示:

SELECT
  t.id, 
  t.first_name, 
  t.last_name
FROM
  People as t
WHERE
  t.last_name > "Smith"
  OR
  (t.last_name = "Smith" and t.first_name > "John")
  OR
  (t.last_name = "Smith" and t.first_name = "John" AND t.id > 1709)
ORDER BY
  t.last_name,
  t.first_name,
  t.id
LIMIT
  @limit_rows

中间WHERE从句是新的。但是写这个谓词比你想象的要复杂。您可能必须处理 NULL 值。您必须处理多个名为 John Smith 且具有不同id值的人的情况。而且您需要非常小心浮点数和NaN值。Cloud Spanner 的读取 API 在这种情况下也很有用,因为它可以更轻松地对表上的范围扫描进行分页。

于 2017-02-16T00:22:42.090 回答