c# - Azure 表存储 - 有序数据的 RowKey 设计

Question

我将大量 GPS 数据存储在存储表中。每个分区最多可以达到 100 万个实体。插入到表中的每个 GPS 实体实际上与之前插入的数据是连续的，因此顺序很重要。

有时我需要执行以下查询：

从当前实体（在同一分区内）获取前/后 3 个 GPS 实体。

RowKey 设计的选项：

创建一个递增的整数。 但是我如何跟踪表格的当前大小？无法获取表格行数或获取最后插入的行。
使用日期时间刻度。 但是如何使用刻度获取上一个/下一个实体？

我在 C# 中使用 SDK 2.0 版。

score 7 · Accepted Answer

这是一个非常酷的问题要解决。

如果您的工作是仅查找在给定条目之后或之前的条目，这将很简单，因为您可以将 DateTime.Now.Ticks 或 (DateTime.Max.Ticks - DateTime.Now.Ticks) 作为RowKey 并在查询中使用“Take”命令来查找最近的 X 记录。

但是，由于您需要找到在给定位置 ID 之后或之前的最近位置，因此我认为这是一种可能适用于您的 RowKeys 的设计模式：

您需要为每个 GPS 位置保存两个实体。实体的数据应该相同，只是行键不同
一个实体的 RowKey 为：DateTime.UtcNow.Ticks，前缀为：“A”（升序）
另一个实体的 RowKey 为：DateTime.MaxValue.Ticks - DateTime.UtcNow.Ticks 并具有前缀字符，例如：“D”（降序）

例如，您有 7 个位置，Location1..thru..Location7 我给了它们从 01 到 99 的随机 Tick 值（为简单起见）。假设 MaxTicks 为 100。这将使我们的表包含以下数据：

Rowkey，实体数据

A----01，位置1
A----50，位置2
A----55，位置 3
A----66，位置4
A----67，位置 5
A----90，位置6
A----99，位置7
D----01，位置7
D----10，位置6
D----33，位置5
D----34，位置4
D----45，位置3
D----50，位置2
D----99，位置1

现在，对于每个实体，您都可以轻松计算其“相反”的 Rowkey 实体。（只需从 DateTime.MaxValue.Ticks 中减去其 RowKey 并将前缀从 A 翻转到 D 或从 D 翻转到 A）

因此，如果您需要 Location3 之前的 2 个实体，只需发出查询以从 RowKey 大于“D----45”且小于“D----99”（最大）的表中获取 2 个实体. 如果您需要在 Location3 之后取 2 行，只需发出 Take 2，其中 RowKey 大于“A----55”且小于“A-----99”（最大值）。发出“小于”标准很重要，这样您在查询“A”时就不会意外遇到“D”。

在批处理事务中更新/插入两组实体，以保证两者都或没有进入表并“瞧”。

这种方法的缺点是您必须支付两倍的存储费用。

希望这会有所帮助并且不会太混乱

c# - Azure 表存储 - 有序数据的 RowKey 设计

1 回答 1

Related

Reference