3

我将大量 GPS 数据存储在存储表中。每个分区最多可以达到 100 万个实体。插入到表中的每个 GPS 实体实际上与之前插入的数据是连续的,因此顺序很重要。

有时我需要执行以下查询:

从当前实体(在同一分区内)获取前/后 3 个 GPS 实体。

RowKey 设计的选项:

  1. 创建一个递增的整数。 但是我如何跟踪表格的当前大小?无法获取表格行数或获取最后插入的行。

  2. 使用日期时间刻度。 但是如何使用刻度获取上一个/下一个实体?

我在 C# 中使用 SDK 2.0 版。

4

1 回答 1

7

这是一个非常酷的问题要解决。

如果您的工作是仅查找在给定条目之后或之前的条目,这将很简单,因为您可以将 DateTime.Now.Ticks 或 (DateTime.Max.Ticks - DateTime.Now.Ticks) 作为RowKey 并在查询中使用“Take”命令来查找最近的 X 记录。

但是,由于您需要找到在给定位置 ID 之后或之前的最近位置,因此我认为这是一种可能适用于您的 RowKeys 的设计模式:

  • 您需要为每个 GPS 位置保存两个实体。实体的数据应该相同,只是行键不同
  • 一个实体的 RowKey 为:DateTime.UtcNow.Ticks,前缀为:“A”(升序)
  • 另一个实体的 RowKey 为:DateTime.MaxValue.Ticks - DateTime.UtcNow.Ticks 并具有前缀字符,例如:“D”(降序)

例如,您有 7 个位置,Location1..thru..Location7 我给了它们从 01 到 99 的随机 Tick 值(为简单起见)。假设 MaxTicks 为 100。这将使我们的表包含以下数据:

Rowkey,实体数据

  • A----01,位置1
  • A----50,位置2
  • A----55,位置 3
  • A----66,位置4
  • A----67,位置 5
  • A----90,位置6
  • A----99,位置7
  • D----01,位置7
  • D----10,位置6
  • D----33,位置5
  • D----34,位置4
  • D----45,位置3
  • D----50,位置2
  • D----99,位置1

现在,对于每个实体,您都可以轻松计算其“相反”的 Rowkey 实体。(只需从 DateTime.MaxValue.Ticks 中减去其 RowKey 并将前缀从 A 翻转到 D 或从 D 翻转到 A)

因此,如果您需要 Location3 之前的 2 个实体,只需发出查询以从 RowKey 大于“D----45”且小于“D----99”(最大)的表中获取 2 个实体. 如果您需要在 Location3 之后取 2 行,只需发出 Take 2,其中 RowKey 大于“A----55”且小于“A-----99”(最大值)。发出“小于”标准很重要,这样您在查询“A”时就不会意外遇到“D”。

在批处理事务中更新/插入两组实体,以保证两者都或没有进入表并“瞧”。

这种方法的缺点是您必须支付两倍的存储费用。

希望这会有所帮助并且不会太混乱

于 2013-03-04T07:29:10.433 回答